メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://factory-docs-academy-content-candidates.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

tbench.ai のベンチマークは、ターミナルベースのインターフェースを使った実世界のソフトウェアエンジニアリングタスクでAIコーディングエージェントを評価します。エージェントがコードベースを移動し、コマンドを実行し、コマンドライン操作を通じて解決策を実装する能力を測定します。

結果

最終更新: 2025年12月

手法

カテゴリ説明
コードナビゲーション関連するコードを見つけて理解する
バグ修正問題を特定して解決する
機能実装新しい機能を追加する
リファクタリング既存のコード構造を改善する
テストテストを書いて実行する
タスクは正確性効率コード品質で採点されます。

Terminal Bench リーダーボード

ライブランキングを表示し、エージェントを提出する