evotraders/tuner/frozen_lake/get_frozenlake_data.py

# -*- coding: utf-8 -*-
"""
Modified from rllm
"""
import argparse
import os

import numpy as np
import pandas as pd


DEFAULT_DATA_PATH = os.path.join(
    os.path.dirname(os.path.abspath(__file__)),
    "..",
    "data",
    "frozenlake",
)


def save_dataset_to_local(
    data_path: str,
    data: list[dict],
    split: str = "default",
) -> str:
    """Save dataset directly to local data_path.

    Args:
        data_path: Path to save the dataset
        data: List of dictionaries containing the dataset examples
        split: Split name (e.g., 'train', 'test', 'default')

    Returns:
        str: Path to the saved parquet file
    """
    os.makedirs(data_path, exist_ok=True)

    # Convert to DataFrame and save
    data_df = pd.DataFrame(data)
    dataset_path = os.path.join(data_path, f"{split}.parquet")
    data_df.to_parquet(dataset_path)

    print(
        f"Saved dataset frozenlake split '{split}' "
        f"with {len(data)} examples at {dataset_path}. "
        f"Make sure to set the environment variable "
        f"<TRINITY_TASKSET_PATH> to {data_path}.",
    )

    return dataset_path


def prepare_frozenlake_data(
    data_path: str,
    train_size: int = 10000,
    test_size: int = 100,
    map_max_size: int = 6,
) -> tuple[list[dict], list[dict]]:
    """
    Prepare and save FrozenLake datasets for training and testing.

    Args:
        data_path (str): Path to save the dataset
        train_size (int): Number of training examples to generate
        test_size (int): Number of test examples to generate
        map_max_size (int): Maximum size of the map

    Returns:
        tuple: (train_data, test_data) - Lists of data dictionaries
    """
    # Set random seed for reproducibility
    np.random.seed(42)

    # Generate random parameters for train and test sets
    train_seeds = np.random.randint(0, 100000, size=train_size)
    test_seeds = np.random.randint(0, 100000, size=test_size)
    train_sizes = np.random.randint(2, map_max_size, size=train_size)
    test_sizes = np.random.randint(2, map_max_size, size=test_size)
    train_ps = np.random.uniform(0.6, 0.85, size=train_size)
    test_ps = np.random.uniform(0.6, 0.85, size=test_size)

    def frozenlake_process_fn(
        seed: int,
        size: int,
        p: float,
        idx: int,
    ) -> dict:
        """Process function to create FrozenLake task instances."""
        return {
            "seed": seed,
            "size": size,
            "p": p,
            "index": idx,
            "uid": f"{seed}_{size}_{p}",
        }

    # Create train and test data
    train_data_list = [
        frozenlake_process_fn(seed, train_sizes[idx], train_ps[idx], idx)
        for idx, seed in enumerate(train_seeds)
    ]
    test_data_list = [
        frozenlake_process_fn(seed, test_sizes[idx], test_ps[idx], idx)
        for idx, seed in enumerate(test_seeds)
    ]

    # Save datasets directly to local DATA_PATH
    save_dataset_to_local(data_path, train_data_list, "train")
    save_dataset_to_local(data_path, test_data_list, "test")

    return train_data_list, test_data_list


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--local_dir", default=DEFAULT_DATA_PATH)
    parser.add_argument("--train_size", type=int, default=10000)
    parser.add_argument("--test_size", type=int, default=100)
    parser.add_argument("--map_max_size", type=int, default=6)
    args = parser.parse_args()

    train_data, test_data = prepare_frozenlake_data(
        data_path=args.local_dir,
        train_size=args.train_size,
        test_size=args.test_size,
        map_max_size=args.map_max_size,
    )

    print(f"Train dataset: {len(train_data)} examples")
    print(f"Test dataset: {len(test_data)} examples")
    print("Sample train example:", train_data[0])
    print("Sample test example:", test_data[0])