MetaGPT/expo/README.md

111 lines
2 KiB
Markdown
Raw Normal View History

2024-08-30 20:35:17 +08:00
# Expo
2024-09-03 13:40:23 +08:00
## 1. Data Preparation
2024-08-30 20:35:17 +08:00
- 下载数据集https://deepwisdom.feishu.cn/drive/folder/RVyofv9cvlvtxKdddt2cyn3BnTc?from=from_copylink
- 修改`data.yaml``datasets_dir`为数据集合集根目录存储位置
2024-08-30 20:35:17 +08:00
2024-09-03 13:40:23 +08:00
## 2. Configs
### Data Config
`datasets.yaml` 提供数据集对应的指标和基础提示词
`data.yaml` 继承了`datasets.yaml`以及一些路径信息,需要将`datasets_dir`指到数据集合集的根目录下
### LLM Config
```
llm:
api_type: 'openai'
model: deepseek-coder
base_url: "https://oneapi.deepwisdom.ai/v1"
api_key: sk-xxx
temperature: 0.5
```
### Budget
实验轮次 k = 10, 20
### 提示词使用
通过执行`dataset.py`中的`generate_task_requirement`函数获取提示词
## 3. Evaluation
运行各个框架运行后框架需要提供Dev和Test的`dev_predictions.csv``test_predictions.csv` column name为target
2024-09-03 14:03:07 +08:00
- 使用`CustomExperimenter`
2024-09-03 13:40:23 +08:00
```
experimenter = CustomExperimenter(task="titanic")
score_dict = experimenter.evaluate_pred_files(dev_pred_path, test_pred_path)
```
## 4. Baselines
### DS Agent
提供github链接并说明使用的命令以及参数设置
### AIDE
提供github链接并说明使用的命令以及参数设置
### Autogluon
提供github链接并说明使用的命令以及参数设置
### Base DI
For setup, check 5.
- `python run_experiment.py --exp_mode base --task titanic`
### DI RandomSearch
For setup, check 5.
2024-08-30 20:35:17 +08:00
- Single insight
`python run_experiment.py --exp_mode aug --task titanic --aug_mode single`
- Set insight
`python run_experiment.py --exp_mode aug --task titanic --aug_mode set`
2024-09-03 13:40:23 +08:00
## 5. DI MCTS
2024-08-30 20:35:17 +08:00
### Run DI MCTS
2024-09-03 13:40:23 +08:00
#### Setup
In the root directory,
2024-09-02 20:00:46 +08:00
2024-09-03 13:40:23 +08:00
```
pip install -e .
2024-08-30 20:35:17 +08:00
2024-09-03 13:40:23 +08:00
cd expo
2024-09-03 13:40:23 +08:00
pip install -r requirements.txt
```
#### Run
- `python run_experiment.py --exp_mode mcts --task titanic --rollout 5`
If the dataset has reg metric, remember to use `--low_is_better`:
- `python run_experiment.py --exp_mode mcts --task househouse_prices --rollout 5 --low_is_better`
2024-08-30 20:35:17 +08:00
2024-09-02 17:01:25 +08:00
2024-08-30 20:35:17 +08:00