MetaGPT/expo/README.md

121 lines
2.3 KiB
Markdown
Raw Normal View History

2024-08-30 20:35:17 +08:00
# Expo
2024-09-03 13:40:23 +08:00
## 1. Data Preparation
2024-08-30 20:35:17 +08:00
- 下载数据集https://deepwisdom.feishu.cn/drive/folder/RVyofv9cvlvtxKdddt2cyn3BnTc?from=from_copylink
- 修改`data.yaml``datasets_dir`为数据集合集根目录存储位置
2024-08-30 20:35:17 +08:00
2024-09-03 13:40:23 +08:00
## 2. Configs
### Data Config
`datasets.yaml` 提供数据集对应的指标和基础提示词
`data.yaml` 继承了`datasets.yaml`以及一些路径信息,需要将`datasets_dir`指到数据集合集的根目录下
### LLM Config
```
llm:
api_type: 'openai'
model: deepseek-coder
base_url: "https://oneapi.deepwisdom.ai/v1"
api_key: sk-xxx
temperature: 0.5
```
### Budget
实验轮次 k = 10, 20
2024-09-05 14:30:36 +08:00
### Prompt Usage
2024-09-03 13:40:23 +08:00
2024-09-04 16:38:33 +08:00
- 通过执行`dataset.py`中的`generate_task_requirement`函数获取提示词
2024-09-05 14:30:36 +08:00
- 非DI-based方法设置`is_di=False`
- `data_config``utils.DATA_CONFIG`
- 每一个数据集里有`dataset_info.json`里面的内容需要提供给baselines以保证公平`generate_task_requirement`已经默认提供)
2024-09-03 13:40:23 +08:00
## 3. Evaluation
2024-09-05 14:30:36 +08:00
运行各个框架运行后框架需要提供Dev和Test的`dev_predictions.csv``test_predictions.csv`每个csv文件只需要单个名为target的列
2024-09-03 13:40:23 +08:00
2024-09-03 14:03:07 +08:00
- 使用`CustomExperimenter`
2024-09-03 13:40:23 +08:00
```
experimenter = CustomExperimenter(task="titanic")
score_dict = experimenter.evaluate_pred_files(dev_pred_path, test_pred_path)
```
## 4. Baselines
### DS Agent
提供github链接并说明使用的命令以及参数设置
### AIDE
提供github链接并说明使用的命令以及参数设置
### Autogluon
2024-09-04 14:49:18 +08:00
#### Setup
```
pip install -U pip
pip install -U setuptools wheel
pip install autogluon
```
2024-09-03 13:40:23 +08:00
提供github链接并说明使用的命令以及参数设置
### Base DI
For setup, check 5.
2024-09-04 16:38:33 +08:00
- `python run_experiment.py --exp_mode base --task titanic --num_experiments 10`
2024-09-03 13:40:23 +08:00
### DI RandomSearch
For setup, check 5.
2024-08-30 20:35:17 +08:00
- Single insight
`python run_experiment.py --exp_mode aug --task titanic --aug_mode single`
- Set insight
`python run_experiment.py --exp_mode aug --task titanic --aug_mode set`
2024-09-03 13:40:23 +08:00
## 5. DI MCTS
2024-08-30 20:35:17 +08:00
### Run DI MCTS
2024-09-03 13:40:23 +08:00
#### Setup
In the root directory,
2024-09-02 20:00:46 +08:00
2024-09-03 13:40:23 +08:00
```
pip install -e .
2024-08-30 20:35:17 +08:00
2024-09-03 13:40:23 +08:00
cd expo
2024-09-03 13:40:23 +08:00
pip install -r requirements.txt
```
#### Run
2024-09-05 14:30:36 +08:00
- `python run_experiment.py --exp_mode mcts --task titanic --rollout 10`
2024-09-03 13:40:23 +08:00
If the dataset has reg metric, remember to use `--low_is_better`:
2024-09-05 14:30:36 +08:00
- `python run_experiment.py --exp_mode mcts --task househouse_prices --rollout 10 --low_is_better`
2024-08-30 20:35:17 +08:00
2024-09-02 17:01:25 +08:00
2024-08-30 20:35:17 +08:00