InfoQ ホームページ 設計/アーキテクチャ に関するすべてのコンテンツ
-
OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引
OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減らす。
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
AWS、管理型エグレスセキュリティ簡素化へ 「Network Firewall proxy」をプレビュー公開
AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。
-
Microsoft Foundry Agent Service、長期メモリのプレビュー版で状態管理をシンプル化
Microsoftは年次カンファレンスIgniteにてFoundry Agent Serviceのメモリ機能、Agent serviceにネイティブ統合されたフルマネージド長期メモリストア、のパブリックプレビュー版を発表した。
-
Uberのクエリアーキテクチャ:レイヤーの簡素化とオブザーバビリティの向上
Uber社は、Apache Pinotのクエリアーキテクチャを再設計し、実行の簡素化、より豊かなSQLのサポート、内部分析ワークロードの予測可能性の向上を図った。従来のNeutrinoシステムは、PrestoとPinotを重ねたものであったが、軽量なプロキシ「Cellar」に置き換えられ、Pinotのマルチステージエンジンライトモードを使用することになった。この再設計は、複雑さを軽減し、実行制限を強化し、複数のテナントに対するより強固な隔離を提供することを目的としている。
-
Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張
Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能となり、広告ランキングの主要指標で200%の向上を達成した。
-
Cloudflare、データプラットフォームをエグレス料金ゼロで導入
Cloudflareは最近、Cloudflare Data Platformのオープンベータ版を発表した。これは、Apache Icebergなどのオープンスタンダードを使用して、分析データテーブルを取り込み、保存し、クエリを実行するためのマネージドソリューションである。
-
JobRunr 8.0、カーボンアウェアジョブ、Kotlinシリアライゼーション、ダッシュボード通知センターを提供
JobRunr 8.0のリリースにより、Carbon Aware Job Processingが導入された。これは、ジョブをスケジュールする際に開発者のカーボンフットプリントを最適化する新機能だ。他の新機能には、Kotlinシリアライゼーションのサポート、新しいダッシュボード通知センター、新しい@AsyncJobアノテーションが含まれており、ルーチンジョブ作成のボイラープレートを削減する。
-
Kubernetes 1.34リリース、KYAML、トラフィックルーティングコントロール、観測性向上
Cloud Native Computing Foundation (CNCF)は先月、「Of Wind & Will」(O’ WaW)と名付けたKubernetes 1.34をリリースした。kubeletやAPIサーバーにおける分散リソース割り当てやプロダクショングレードのトレーシングなどの機能を導入している。
-
Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上
Meta社は、Instagramにおいて新しい機械学習フレームワークを導入した。このフレームワークは多様性アルゴリズムを適用し、繰り返し表示されるコンテンツを減らしながらユーザーエンゲージメントを維持できるものだ。この多様性を意識したランキングシステムは、同じコンテンツ作成者や製品タイプへの過剰な露出を軽減するために、既存のエンゲージメントモデルに乗算ペナルティを導入している。
-
AWSが第5世代AMD EPYC(Turin)プロセッサ搭載M8a汎用EC2インスタンスを発表
AWSは最近、最大4.5GHzの5世代目AMD EPYC(コードネーム:Turin)プロセッサ、ゲーム、金融アプリケーション、機械学習の推論、動画エンコード、アプリケーションサーバー、シミュレーションモデリング、中規模データストア、アプリケーション開発環境、キャッシュフリートのような高性能と高スループットを必要とするアプリケーションに適している、を搭載したM8a汎用インスタンスの一般提供(GA)を発表した。
-
AWSが「リージョン別の AWS 機能」ツールをリリース
AWSは最近、「リージョン別の AWS 機能」、グローバルなリージョンネットワーク全体でのサービス、機能、リソースのアベイラビリティをアー���テクト、プラットフォームエンジニア、開発者が詳細に把握できるよう設計された新しい計画ツールをリリースした。
-
AWS、集中型クロスアカウントキャパシティ最適化を実現するEC2 Capacity Managerを発表
AWSは最近、Amazon EC2 Capacity Managerという新しい集約型ソリューションを導入した。これにより、すべての顧客アカウントおよびAWSリージョンにわたるEC2キャパシティ使用状況の監視、分析、管理を単一のインターフェースで統合可能になった。
-
OpenJDKニュースまとめ:キー導出、スコープ付き値、コンパクトヘッダー、JFRメソッドタイミングとトレーシング
2025年5月12日の週、OpenJDKエコシステムでは活発な動きが見られた。注目すべきは、2つのJEPがProposed to TargetからTargetedに昇格し、4つのJEPがCandidateからProposed to Targetに昇格したことである。また、1つのJEPがJEP DraftからCandidateステータスに昇格した。これらのうち2つは、それぞれのプレビューラウンドを経て最終化される予定である。