NL2ProcessOps/eval_retrieval at main · iaiamomo/NL2ProcessOps

History

Name		Name	Last commit message	Last commit date
parent directory ..
LLMtools2process		LLMtools2process
data		data
ModTaskPreRAG.py		ModTaskPreRAG.py
ModTaskRAG.py		ModTaskRAG.py
README.md		README.md
TaskRAG.py		TaskRAG.py
ToolsManagerDB.py		ToolsManagerDB.py
res_values.py		res_values.py

README.md

Tools Retrieval evaluation

TaskRAG.py: extract task from process description
ModTaskRAG.py: extract model and relative tasks from process description
ModTaskPreRAG.py: extract model and relative tasks and preprocessing of tasks from process description
ToolsManagerDB.py: retrieval module implementation

Dataset

LLMtools2process_v2: set of 30 textual process descriptions generated with an LLM from a set of 62 tools

Results

$precision=t_{p}/(t_{p}+f_{p})$
$recall=t_{p}/(t_{p}+f_{n})$
$t_{p}=$ correct tool extracted
$f_{p}=$ no correct tool extracted
$f_{n}=$ correct tool no extracted

           case  model    recall  precision
0          task  gpt35  0.770327   0.742198
1          task   gpt4  0.773579   0.790755
2      mod_task  gpt35  0.762037   0.730392
3      mod_task   gpt4  0.764795   0.766513
4  mod_task_pre  gpt35  0.777326   0.756105
5  mod_task_pre   gpt4  0.761764   0.762833

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

eval_retrieval

eval_retrieval

README.md

Tools Retrieval evaluation

Dataset

Results

Files

eval_retrieval

Directory actions

More options

Directory actions

More options

Latest commit

History

eval_retrieval

Folders and files

parent directory

README.md

Tools Retrieval evaluation

Dataset

Results