DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

使用场景

  • 部署成本低:无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。
  • 网络依赖小:适合地铁、银行、政务等多种场景的虚拟助理自助服务。
  • 功能多样化:可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。

产品特色

  • 支持低成本快速部署在多种终端及大屏
  • 适应地铁、银行、政务等多种场景的虚拟助理自助服务
  • 满足视频、媒体、客服、金融、广电等多个行业的多样化需求
  • 提供数字人定制服务,基于视频进行定制
  • 数字人动作API控制(目前不支持)
  • 播报开始结束的回调方法详见sdk文档

用户群体

DUIX适合需要快速部署AI数字人交互解决方案的开发者和企业。无论是在公共服务、金融咨询还是媒体展示等领域,DUIX都能提供个性化、智能化的交互体验。

使用教程

  1. 访问DUIX的GitHub页面,了解产品详情
  2. 根据需要下载相应的数字人本地模型
  3. 阅读并遵循DUIX的开源文档进行开发和部署
  4. 接入所需的大模型和语音识别、合成能力
  5. 在Android或iOS端进行应用开发和数字人交互实现
  6. 根据具体场景定制数字人形象和声音(如需定制)
  7. 测试并优化交互体验,确保产品满足使用需求

常见问题

可以支持数字人定制吗?是基于照片还是视频?
可以支持数字人定制,我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务,您可以通过微信扫码与我们联系。
如何定制形象?
定制硅基数字人需要拍摄一段 3-5 分钟的真人出镜口播视频,具体出镜姿势、口播内容,可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频,即可选择正装出镜,口播法律相关内容,这样整体情景比较一致。
定制形象如何收费?
我们提供与SDK开源接口配套的数字人定制,包括形象+声音,若有更多定制需求,可以联系客服邮箱。
数字人形象怎么更新?
目前开源的主要提供公共模特,有需求可以定制。
形象克隆有API接口么?
训练服务目前只支持部署在我们的内部服务器进行调用。
播报的wav文件,支持流式数据吗?
流式驱动正在做改造优化,暂时还不支持;
播报开始结束有没有相关回调方法?
播报开始结束的回调方法详见sdk文档
数字人动作有没有相关api控制?
数字人动作API,暂时还不支持
下载的文件如何替换?
下载文件的替换详见代码

联系

邮箱:maoliyan@guiji.ai

相关导航

暂无评论

暂无评论...