EVA-Bench Data 2.0 : un nouveau benchmark pour les LLM en entreprise
ServiceNow AI a dévoilé EVA-Bench Data 2.0, un benchmark open source évaluant les LLM dans 213 scénarios d’entreprise complexes avec 121 outils.
ServiceNow AI a dévoilé EVA-Bench Data 2.0, un benchmark open source évaluant les LLM dans 213 scénarios d’entreprise complexes avec 121 outils.