2026年5月9日 · 土曜日

Perplexity、内部エージェントスキル構築マニュアルを公開

Perplexityはエージェントスキル構築のための内部実践マニュアルを公開。「Designing, Refining, and Maintaining Agent Skills at Perplexity」と題され、スキルの設計・最適化・保守を網羅。開発者は考え方を変え、検索、推論、システム設計を中心に革新する必要があると強調している。

GPT-5.5-Cyber公開、重要インフラ保護へ

GPT-5.5-Cyberモデルが、重要インフラを保護するための防御者向けに限定プレビューとして公開された。サイバーセキュリティ分野に特化した非常に強力なモデルとされ、重要インフラ防衛の新たな武器として期待されている。

@v0 新機能のデモより

v0、ターミナルコマンド実行に対応し機能を大幅拡張

v0にターミナルコマンド実行機能が追加された。ブラウザテスト操作、コミット履歴の表示、単体テストの作成・実行、CLI経由でのVercelやGitHubとの連携が可能に。エージェント型開発ツールの新たな基準を打ち立てるアップデート。

Claude Code、今週60以上の信頼性修正を展開

先週の50以上の修正に続き、Claude Codeは今週60以上の改善を導入。よりスムーズな長時間セッション、より効率的なエージェントループ、ターミナル互換性の向上などを含む。3,000以上のいいねを集め、開発者コミュニティから高い評価を得ている。

we'd like to help companies secure themselves and we think it's important to start work on this quickly

Sam Altman · OpenAI CEO

vLLM-Omni v0.20.0リリース、Qwen3-Omniのスループットが72%向上

新しいvLLM-OmniバージョンはアップストリームのvLLMに準拠し、H20上でQwen3-Omniのスループットを72%向上。CUDA 13.0、PyTorch 2.11、Transformers 5.xに対応。TTS性能も大幅に最適化され、VoxCPM2のRTFが0.946から0.106に改善された。

gdb氏、GPT-5.5は強力かつ簡潔な回答と明かす

Anthropic共同創業者のgdb氏が、GPT-5.5モデルは非常に強力でありながら非常に簡潔であると評価。高い能力と簡潔さを両立したモデル性能の向上が示唆されている。

@drjimfan · Sequoia AI Ascent より

Jim Fan氏、Robotics: Endgame講演で物理AGIのロードマップを提示

NVIDIAのJim Fan氏がSequoia AI Ascentカンファレンスで「Robotics: Endgame」と題した講演を実施。昨年の「Physical Turing Test」の続編として、LLMの成功物語を並行例に物理AGIの解決ロードマップを提示。1,300以上のいいねを集め、ロボティクス×AIの方向性を示す重要な講演として話題に。

@hardmaru より

研究:ハードウェアがLLMの自然なスパース性を罰している

人脳は必要なニューロンのみを活性化することで高い効率を実現しているが、LLMも自然に95%以上のフィードフォワード層ニューロンが静寂を保つというスパース性を持つ。しかし現在のハードウェアアーキテクチャはこの特性を罰する構造になっており、変革が求められている。

SkillOS:強化学習による自己進化型エージェントスキル管理

SkillOSは、凍結された実行器と学習可能な管理器を組み合わせ、報酬合成とタスク依存グループ訓練により累積経験からスキルライブラリを更新する手法。多段階推論・単段階推論の両方で、メモリなしおよび強メモリベースラインを上回る性能を示した。

CDM:連続時間分布マッチングによる少数ステップ拡散蒸留

CDMは拡散モデル蒸留を離散最適化から連続最適化へ拡張し、動的連続スケジュールと速度場外挿によりサンプリング経路上の任意点で分布マッチングを実施。GANや報酬モデルなどの補助モジュール不要で、4ステップサンプリングで高い視覚忠実度を実現する。

Apple、TIDEを発表:全層がトークンの文脈上のアイデンティティを把握

TIDEはLLMの「1回限りの埋め込み」設計欠陥に対処するEmbeddingMemory機構を提案。K個の独立したメモリブロックで文脈非依存の意味ベクトルを計算し、深度条件ルーティングで各層にトークンアイデンティティ情報を注入する。希少トークンの訓練不足と文脈崩壊の両問題を解決する。

MiniMax社長:AGIは3年以内に到来する

MiniMaxのグローバルビジネス担当社長Linda Sheng氏がCerebral Valley Voice Summitで講演。AGI競争、公開市場の圧力、フロンティアに立つことの真の意味について議論し、AGIはあと3年で実現するとの見解を示した。

OpenAIDevs、期間限定リソースを公開

OpenAIDevsが「ゴブリンに見つかるまで利用可能」と称して supply.openai.com を公開。具体的な内容は明かされていないが、800以上のいいねを集め開発者コミュニティの注目を集めている。

製品 & 業界動向05.09

Luma、クリエイティブエージェントLuma Agentsを発表

Luma Agentsはクリエイティブワークの各段階で企画・生成・反復を支援し、ブランドが展示会ブースのビジュアルアイデンティティを確立できる。

Higgsfield AI、広告クリエイティブ複製エージェントを発表

MCP経由で広告参照を接続し、成功した動画を読み取って同じパターンで新しい広告を生成。OpenClawなどのパイプライン向けに構築。

Recraft V4、多様なスタイルのベクターロゴを生成可能に

ミニマル、ヴィンテージ、マスコット、ラグジュアリー、テックなど多様なスタイルに対応。すべての出力がベクター形式で、ウェブ・印刷に即利用可能。

gdb氏:Codexはコーディングだけの道具ではない

Anthropic共同創業者がCodexは「すべてのコンピューター作業のための変革的ツール」と評し、コーディングを超えた汎用性を強調。

Perplexity CEOがエージェント構築の研究ブログを共有

Computerなどの製品向けにエージェントとエージェントスキルを構築する方法についての研究ブログを紹介。

Elon Musk氏:「Grok upgrades」と投稿

わずか2語の投稿でGrokのアップグレードを示唆。1万以上のいいねと350万回以上の表示を記録し、大きな注目を集めている。

gdb氏、Anthropicアライメントチームの研究を絶賛

「extremely interesting work」と評し、AI安全性分野でのAnthropicの進展を示唆。

NVIDIA AIレーザーロボットが化学薬品不使用の除草を実現

Carbon RoboticsがNVIDIA AIで誘導されるレーザー技術を活用し、化学薬品に頼らない健康的な収穫を実現する除草ロボットを開発。

Vibecon:クリエイティブAIカンファレンスが6月にNYCで開催

Replit主催、6月17-18日開催。AIアート、映画、音楽、ARなどを網羅し、Spike JonzeやRefik Anadolらが登壇予定。早期割引チケット販売中。

Replit 10周年Buildathon、上位10作品を発表

24時間で2万人以上が参加、賞金総額10万ドル超。コミュニティの創造力が遺憾なく発揮されたイベントに。

論評:単一Transformerによるマルチモーダル統合は経済的に最適ではない

単一Transformerですべてを処理できるからといって、それが経済的に最も理にかなっているとは限らない。ただし将来的にはそうなる可能性があるとの見方。

Cola DLM:連続潜在拡散言語モデル

テキストVAEによる安定したテキスト→潜在マッピングと、ブロック因果拡散Transformerを組み合わせた階層的潜在拡散言語モデル。約20億パラメータ規模でスケーリング挙動を検証。