Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
aqua_interpret_and_evaluate.py		aqua_interpret_and_evaluate.py
aqua_interpret_and_evaluate_ensemble.py		aqua_interpret_and_evaluate_ensemble.py
aqua_interpret_and_evaluate_llama.py		aqua_interpret_and_evaluate_llama.py
baseline_interpret_and_evaluate.py		baseline_interpret_and_evaluate.py
csqa_interpret.py		csqa_interpret.py
interpret_and_evaluate.py		interpret_and_evaluate.py
interpret_and_evaluate_ensemble.py		interpret_and_evaluate_ensemble.py

README.md

Post-Processing and Evaluating

PS: Please adjust the argument to sys.path.append() accordingly.

Baseline Outputs

baseline_interpret_and_evaluate.py

Required argument: path to the output file for evaluation.

Ours Outputs

interpret_and_evaluate.py

Required argument: path to the output file for evaluation.

interpret_and_evaluate_ensemble.py

Please adjust N and filenames for majority voting.

AQUA Outputs

aqua_interpret_and_evaluate.py
aqua_interpret_and_evaluate_ensemble.py

Since AQUA requires to select from several choices according to the reasoning result, an addtional step of prompting is required to conduct the selection. Therefore, we have separate scripts to post-process the outputs.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

execute_and_evaluate

execute_and_evaluate

README.md

Post-Processing and Evaluating

Baseline Outputs

Ours Outputs

AQUA Outputs

Files

execute_and_evaluate

Directory actions

More options

Directory actions

More options

Latest commit

History

execute_and_evaluate

Folders and files

parent directory

README.md

Post-Processing and Evaluating

Baseline Outputs

Ours Outputs

AQUA Outputs