投稿内容
- Fable 5を2日間使った体感をまとめた投稿です。
- IQの強さ、GPT-5.5 proとの比較、人間世界の理解、提案力を見ています。
- 単に賢いだけではなく、EQは高いのにKYで、真実を追求するような癖も重要です。
朱雀|SUZACQUE
モデル評価は、ベンチマークだけでは足りません。実際に使った時に、どこまで人間世界を理解し、どれくらい深く提案し、どんな癖があるのかを見る必要があります。
高性能モデルは、正解を出すだけでなく、人間の仕事、関係、判断、違和感まで扱えるかで差が出ます。
新しいAIを早く試し、良い点と危うさを体感で整理する。そういうモデルレビューです。
元の投稿や返信欄まで読む場合は、Xで続きを見られます。