AutoArena: Đánh giá tự động để phân loại các hệ thống GenAI khác nhau.
Thông tin
AutoArena: AutoArena là một công cụ mã nguồn mở cho việc đánh giá tự động sử dụng các trọng tài LLM để phân loại các hệ thống GenAI.
Trường hợp sử dụng
So sánh các LLM khác nhau hoặc các biến thể prompt để đạt hiệu suất tối ưu
Đánh giá các hệ thống AI sinh trong các thiết lập tích hợp liên tục