Retour au portfolio
Section 10

Evaluation de modeles

Rigorous benchmarking of LLMs utilisant metrics like BLEU, ROUGE, et Perplexity.

Projets dans cette section: 0

LLM Metrics (BLEU/ROUGE)
Evaluation de modelesChemin local

LLM Metrics (BLEU/ROUGE)

performance evaluation pour texte generation.

Summarization Benchmark
Evaluation de modelesChemin local

Summarization Benchmark

Comparative evaluation of T5 vs GPT2.