AI技術チームによる技術発信記事の連載第14回目をアップいたしました

AI 技術チームよるAI・機械学習に関する技術情報連載第14回を公開いたしました。

今回は、「AIによる自動ソフトウェア開発の可能性:大規模言語モデルを評価するベンチマーク(SWE Bench)と最新の取り組み」というテーマです。コード生成のベンチマーク「SWE Bench」の結果から見える現状のLLMの課題と、最新のAIエージェント・アプリケーション「Devin」や「Open Devin」の取り組みについて紹介します。LLMがもたらす開発プロセスの変革と、その可能性や課題について探っていきます。

詳しくは、記事本文をご覧ください。

技術情報記事

AI技術チームによる技術発信 第14回ーー AIによる自動ソフトウェア開発の可能性:大規模言語モデルを評価するベンチマーク(SWE Bench)と最新の取り組み