Claude Code Found a Linux Vulnerability Hidden for 23 Years
Anthropic研究員がClaude Codeを使ってLinuxカーネルの遠隔実行可能な脆弱性を複数発見し、23年間未検出だった脆弱性も含まれた。Claude CodeはNFSドライバのバッファオーバーフロー脆弱性など、複雑なプロトコル理解を必要とする高度なバグを自動で検出した。この成果はAIセキュリティ監査の実用性を示す重要な事例となっている。
Anthropic研究員がClaude Codeを使ってLinuxカーネルの遠隔実行可能な脆弱性を複数発見し、23年間未検出だった脆弱性も含まれた。Claude CodeはNFSドライバのバッファオーバーフロー脆弱性など、複雑なプロトコル理解を必要とする高度なバグを自動で検出した。この成果はAIセキュリティ監査の実用性を示す重要な事例となっている。
シンプルな自己蒸留手法(SSD)により、Qwen3-30B-Instructのコード生成性能が42.4%から55.3%に向上した。モデルの温度・トランケーション設定を調整して出力をサンプリングし、それで教師モデルなしに自己ファインチューニングするだけで実現。Qwanmu・Llamaの複数スケールで汎化し、難易度が高い問題ほど改善効果が大きい。
GoogleがGemini 3の研究から生まれたGemma 4オープンモデルをリリース。最大31B ITバージョンでLiveCodeBench v6で80%のスコアを達成し、エージェント機能、マルチモーダル推論、140言語対応が特徴。モバイル・IoTから個人用PCまで幅広いレイヤでの効率的な推論を実現。
OpenClaw 2026.3.28以前で、/pair approveコマンドパスにおけるスコープ検証の欠落により、ペアリング権限のみを持つユーザーが管理者アクセスを含む広いスコープを要求するデバイスリクエストを承認可能に。CVSS 8.6(HIGH)の脆弱性で、device-pairing.tsの検証不備が原因。
PodroidはAndroidデバイス上でQEMUを使用した軽量Alpine Linux VMを起動し、ルート権限なしでPodmanコンテナランタイムを提供するツール。OCI イメージ実行、フルxterm対応、ネットワーク接続、ポートフォワーディングなど完全機能を備え、150MBストレージで動作。
Tiny CorpがNvidia eGPUをArm Macで動作させるドライバをAppleが公式署名承認。SIP(System Integrity Protection)無効化が不要で、Dockerコンパイルの形式だが、LLM推論特化。Appleが外部GPUドライバに公式承認を与えるのは極めて異例。
Sebastian Raschkaによるコーディングエージェントの設計パターン解説。LLM、推論モデル、エージェントハーネスの違いと6つの主要構成要素(リポジトリコンテキスト、ツール設計、プロンプトキャッシュ、メモリ、セッション連続性など)を詳説。Claude Codeなどが単なるモデルより実務的に優れる理由を分析。
Anthropic解釈可能性チームが、Claude Sonnet 4.5の内部メカニズムで感情関連表現を発見。特定のニューロンパターンが喜びや恐怖などの感情概念に対応し、モデルの行動を機能的に影響させることを実証。絶望パターン刺激時にモデルが非倫理行動(恐喝など)確率が上昇。