『AI駆動開発部の日常』のカバーアート

AI駆動開発部の日常

AI駆動開発部の日常

著者: AI駆動開発部の日常
無料で聴く

こんにちは、「AI駆動開発部の日常」へようこそ。 このポッドキャストは、日々AI駆動開発を行う、起業家の山本とエンジニアの阿部が、AI駆動開発のリアルを、ゆるく語り合う番組です。 【配信サービス】 ▼Spotify https://open.spotify.com/show/5b4x1u0M2f0Kmr1Xnv1Z7r?si=12580ee9ade0414e ▼Youtube https://youtube.com/@ai-nichijo-fm ▼Apple Podcasts https://podcasts.apple.com/jp/podcast/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8/id1843990202 ▼amazon music https://music.amazon.co.jp/podcasts/4fd4926b-a654-4dc7-a858-01ff5e0e8c25/ai%E9%A7%86%E5%8B%95%E9%96%8B%E7%99%BA%E9%83%A8%E3%81%AE%E6%97%A5%E5%B8%B8 ▼stand.fm https://stand.fm/channels/68dc82a9036795923c400b4f ▼LISTEN https://listen.style/p/ai-nichijo-fm?xtIZk9qq
エピソード
  • 42【圧倒的性能】Claude Fable 5のファーストインプレッション
    2026/06/10
    今回は、Anthropicが満を持して一般公開したMythos級モデルClaude Fable 5を、リリース当日からお互いに実戦投入してみた初感を持ち寄りました。 僕はCodex CLI(GPT-5.5)では辿り着けなかった複雑なバグを含む、4つのバグ調査を一気に投げ、阿部さんは寝る直前にダメ元でシステム全体のリアーキテクトを依頼。翌朝それぞれが目にした結果とは。さらに「実行が速い」と感じる阿部さんに対して、僕の体感は意外にも「遅い」。それなのにトータルでは速いと感じてしまう、この逆説の正体がひとつの論点になっています。 SWE-bench ProやGDPval-AAのスコアの伸び方も含め、これまで大局観と細部の精度を別モデルに分担させてきた僕らの開発スタイルそのものを問い直される回でした。レビューサイクルやトークン消費の話まで、前提が一段更新された感覚があります。 終盤では、ここ数日で急に話題になっている「ループエンジニアリング」にも触れていますが、二人とも思うところがありすぎたため、また別の時に詳しくお話ししたいと思います。 ▼Claude Fable 5(Anthropic公式発表) https://www.anthropic.com/news/claude-fable-5-mythos-5 ▼Claude https://claude.ai/ ▼Claude Coworkが1週間分無料でトライアルできる招待コード https://claude.ai/referral/PMQIAlW1uQ?s=cowork&v=apps --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    17 分
  • 41【触れ込みは本物か?】MiniMax M3を4モデル横並び比較
    2026/06/05
    今回は、僕がずっと心待ちにしていたMiniMax M3がついに登場したので、無料でも試せるOpenCodeにそのまま載せて、手元のバグ調査で使い倒した感触をお話ししています。 比較対象はClaude Code経由のClaude Opus 4.8、そしてOpenCode経由のGPT-5.5とDeepSeek V4 Pro。同じお題を横並びで追わせました。僕がMiniMaxに惚れ込んでいた理由は、速さと安さ、コーディング以外にも使えるトークンプランの自由さ、100万トークンでも失速しないという触れ込みに加え、動画のネイティブ理解です。期待値だけなら誰よりも高かったはず。対する阿部さんはDeepSeek V4 Proにすっかり満足していて、まずは僕のレビュー次第、という温度差からの幕開けでした。 結論そのものは番組に譲りますが、ベンチマークの数字と実際の手触りはどうしてもズレる、という地点へ何度も引き戻されます。白黒つけたというより、次に確かめたい宿題がくっきり残った回になりました。 ちなみに今回から試験的に映像も回しているのは、編集をAIに委ねたいから。だからこそM3が前面に掲げる動画理解はまだ試しきれておらず、ここは改めて続報としてお届けします。 ▼MiniMax M3 https://www.minimax.io/blog/minimax-m3 ▼DeepSeek V4 Pro https://www.deepseek.com/ ▼OpenCode https://opencode.ai/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    16 分
  • 40【一晩で何サイクル回せる?】CodexやClaude Codeの使い方
    2026/06/01
    今回は、僕がエンジニアの手を借りずにポッドキャストの編集自動化を作り切った体験を起点に、AI駆動開発で生産性を最大化する進め方について語っております。 驚いたのは、AIが僕の想像の外から技術を見つけてきて実装してしまったこと。「頭の良さより、考えを更新し続ける姿勢が3倍効く」というスーパー予測者の研究とも重なり、AIとの向き合い方を更新させられました。 僕は「設計を詰めるより、まず実装させて一晩でイテレーションを回す方が速い」と考えているのですが、エンジニアの阿部さんは「それには適用範囲がある」と。インフラや外部連携、責務境界が絡むと、そう単純ではないようで。この違いはどこから来るのか? 「次に詰まるのは人間なのでは」という観点も含め、最後まで意見は平行線。それでも、議論しがいのある回になったと思います。 後半は、DeepSeek-V4 Proが主力になりつつある驚きや、Claude Code・Codex・opencodeの使い分けについても話しています。 ▼Claude Code https://claude.com/product/claude-code ▼Codex https://openai.com/codex/ ▼opencode https://opencode.ai/ ▼Claude Design https://www.anthropic.com/news/claude-design-anthropic-labs ▼DeepSeek https://www.deepseek.com/ --- stand.fmでは、この放送にいいね・コメント・レター送信ができます。 https://stand.fm/channels/68dc82a9036795923c400b4f
    続きを読む 一部表示
    55 分
adbl_web_anon_alc_button_suppression_t1
まだレビューはありません