OrcaRouter、DeepSeek V4 Pro APIを75%割引で提供開始 エンタープライズAIコスト、最大40%削減へ
見出し
FlashLabs株式会社(東京都千代田区)は、提携先の米Continuum AIが提供するAIゲートウェイ「OrcaRouter」において、DeepSeek V4 Pro APIを約75%割引価格で提供を開始したと発表しました。これにより、エンタープライズAIエージェントワークフローにおけるLLM(大規模言語モデル)の運用コストを大幅に削減し、企業のAI活用を加速するとしています。品質を維持しながら、LLM運用コストを最大約40%削減することが可能になるといいます。
背景:AIエージェント普及と運用コストの課題
2026年は、エンタープライズAIエージェントワークフローが本格的に普及する転換点とされています。Gartnerの予測では、同年末までに企業アプリケーションの約40%がAIエージェントを組み込む見込みで、業務自動化の新たな標準となりつつある状況です。
一方で、LLMの運用コストは、プロダクトの成長に伴い増加する新たな原価として、企業の経営課題となっています。多くの企業が、すべての処理を高性能モデルに投入することで品質を確保しているものの、本来高性能モデルを必要としない定型処理にも高コストを支払い続けているのが現状とされます。
この課題に対し、OrcaRouterはプロンプトごとに難易度を判定し、高度な推論はフロンティアモデルへ、定型処理は高性能なオープンモデルへ自動ルーティングする仕組みを提供してきました。これにより、品質を維持しつつLLM支出を約40%削減できるとしています。
OrcaRouterとDeepSeek V4 Pro API割引の概要
今回、DeepSeek社がV4 Pro APIの約75%割引を発表したことを受け、OrcaRouterも同価格での提供を開始しました。
DeepSeek V4 Pro APIの価格は、入力が1Mトークンあたり0.14ドル、出力が1Mトークンあたり0.28ドルで、これは通常価格から約75%の割引となります。OrcaRouterはプロバイダー公開価格と同額(トークン上乗せ0%)で提供するとしています。
OrcaRouterの主な機能には、1ミリ秒未満でのプロンプト難易度判定による最適モデル自動ルーティング、LinUCBコンテキスト・バンディットによる学習型ルーティング、リクエスト単位の可視化(判定根拠、モデル、プロバイダー、価格)、ミッドストリーム切り替えによる99.99%稼働率保証、そしてOpenAI互換APIによる容易な導入が挙げられます。
対応モデルとしては、DeepSeek V4 Pro APIのほか、Anthropic Claude Opus 4.7 API、OpenAI GPT 5.5 APIなど、200以上のモデルを1つのエンドポイントで提供しています。
-
DeepSeek V4 Pro API: https://www.orcarouter.ai/ja/models/deepseek/deepseek-v4-pro
-
Anthropic Claude Opus 4.7 API: https://www.orcarouter.ai/ja/models/anthropic/claude-opus-4.7
-
OpenAI GPT 5.5 API: https://www.orcarouter.ai/ja/models/openai/gpt-5.5
企業にもたらす価値とエンタープライズ対応
OrcaRouterの導入により、企業は以下の価値を得られるといいます。
- 劇的なコスト削減: 月間約1万ドル規模のLLM利用で、年間約47,700ドルのコスト削減を見込めるとしています。DeepSeek V4 Proの利用で、従来比約75%のコスト削減が可能になるといいます。
- 品質を保った最適化: プロンプト難易度を自動判定し、定型処理(約65%)はオープンモデルで約15分の1のコストで処理し、高度な推論(約35%)はフロンティアモデルで処理することで、品質を損なうことなくコストを最適化します。
- 完全な透明性: トークン課金はプロバイダー公開価格と同額(上乗せ0%)であり、リクエスト単位で判定根拠、モデル、プロバイダー、価格を可視化し、監査性を確保します。
- エンタープライズ対応の信頼性: ミッドストリーム切り替えにより、プロバイダー障害時も自動フェイルオーバーし、エージェントループの状態を維持しながら99.99%の稼働率を実現します。
- 即座の導入: OpenAI互換APIにより、既存コードの変更は約1行で済むため、低コストでの導入と切り戻しが可能で、検証から本番まで進めやすい設計とされます。
OrcaRouterは、エンタープライズAIエージェントワークフローに最適化された設計となっています。定型処理と高度な処理が混在し、リアルタイムでの意思決定が求められるエージェントワークフローにおいて、プロンプト単位での最適モデル選択や実行結果からの学習によるルーティング精度改善、エージェントの状態を維持したフェイルオーバーを実現します。
また、本番運用に必要なセキュリティ統制として、モデル到達前にゲートウェイでガードレール機能を適用。個人情報保護(PII Shield)、認証情報保護(Secrets & API Keys)、プロンプトインジェクション対策、ブランド安全性フィルタ、金融データ保護(PCI)、システム情報保護(System-Prompt Leak)、コンプライアンス監査(Compliance Logger)、入力サイズ制限(Prompt-Size Cap)の8つのガードレール機能を提供し、企業のセキュリティポリシーに合わせた柔軟な設定が可能とされます。
今後の展開
FlashLabsは、Continuum AIとの日本独占ディストリビューション提携を通じて、OrcaRouterの日本市場での普及を支援していく方針です。今後も最新LLMモデルへの対応、ルーティング精度の向上、エンタープライズ機能の拡充を継続的に実施し、企業のAI活用における「品質」と「コスト」の両立を実現するとしています。
同社は、機械の処理速度・精度と人間の戦略的洞察を融合させる「Human-AI Hybrid」のビジョンのもと、企業に新たな価値をもたらすことを目指しています。
FlashLabs株式会社について
FlashLabs株式会社は、東京都千代田区に本社を置くAI応用研究所です。営業とカスタマーエクスペリエンスの自動化・自律化を目指し、「Human-AI Hybrid」で企業に成果をもたらすことを目標としています。オープンソース音声モデル「Chromaシリーズ」の開発元であり、Continuum AIとの提携により「OrcaRouter」を日本市場に提供しています。
-
FlashLabs株式会社公式サイト: https://www.flashlabs.ai/
-
OrcaRouter公式サイト: https://www.orcarouter.ai/ja
-
OrcaRouterの無料APIキー取得: https://www.orcarouter.ai/register
Continuum AIについて
Continuum AIは、次世代AIインフラを開発する米国の研究機関です。適応型推論ゲートウェイ「OrcaRouter」を開発し、企業のAI活用における品質とコストの両立を実現する技術を提供しています。
- Continuum AI公式サイト: https://www.continuum01.ai/
ソース元
OrcaRouter、DeepSeek V4 Pro APIを75%割引価格で提供開始 ― エンタープライズAIエージェントワークフローのコスト最適化を加速
https://www.flashlabs.ai/
