Logo

ホーム Next テクノロジー Next 人工知能

人工知能

音声・ビジョン・エージェントの実装型AI。Azure AIベース。

人工知能

音声・ビジョン・エージェントの実装型AI。Azure AIベース。

現場で役立つAI。音声、ビジョン、エージェント型ワークフローで成果を可視化。PoCから本番まで、diliumは運用しやすくスケールするシステムを構築します。

提供内容

  • ニューラルボイス:プロ声優のクローン音声で動的なストーリーテリングやローカライズ - リテール案件(NDA対象)。
  • Document AI:文書の分類・抽出・ルーティングを行い、カスタムCMSワークフローに自動投入 - Gabettiで導入。
  • Agent AI:n8nやMicrosoft Copilot Studioでオーケストレーションする専用パイプラインと自動化。
  • ビジョン検査:傷や形状不良の検出 - Deeteckプロジェクト。
  • リアルタイムトラッキング:YOLOによるカメラストリーム追跡 - AppleエンタープライズAPI連携のSpatial Planプロジェクト。
  • フォトグラメトリ:写真から高精度3Dモデルやエリアを生成 - 3DtoMeプロジェクト。

プロダクション品質:Privacy by designとGDPR準拠、必要に応じたHITL、モデル評価、テレメトリと監視、CI/CDとMLOps。

スタック:Azure OpenAI Service、Azure AI Vision・Document Intelligence、Azure Speech、Azure ML、Ultralytics YOLOv8、OpenCV、Python、Swift・SwiftUI。必要に応じてCore MLによるオンデバイス実行、AIをSpatial Computing(AR/VR)の体験やApple Vision Proに組み込みます。

Spatial Computing3DtoMeSpatial Planをチェックし、チームを知り、お問い合わせください。MVPから本番展開まで支援します。

参考:Microsoft Azure AI(2025年確認);Ultralytics YOLOv8 Docs(2025年確認);Apple visionOS(2025年確認);n8n Docs(2025年確認)。

enitfrjaes