专注于音视频处理及流媒体开发!

罗索

  • [『音频智能』] [深度学习概念]·主流声学模型对比 日期:2021-07-01 15:57:10 点击:192 好评:0

    本文由搜狗语音交互中心语音技术部负责人陈伟来为大家分享伴随着本轮人工智能浪潮下语音识别建模技术的演进,希望能够帮大家理清主流的识别建模脉络以及背后的思考。...

  • [『音频智能』] 音频编解码标准 日期:2021-06-03 10:58:24 点击:201 好评:0

    PCMU(G.711U) 类型:Audio 制定者:ITU-T 所需频宽:64Kbps(90.4) 特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。 优点:语音质量优 缺点:占用的带宽较高 应用领域:...

  • [『音频智能』] 音视频开发基础知识 日期:2021-06-03 10:54:03 点击:58 好评:0

    今天学习一下音视频的基础知识,日常工作中都会接触到音视频的开发,比如目前工作中都会涉及到 TSPlayer、IjkPlayer、MediaPlayer 提供播放能力,不管是什么 Player,其上层调用都是大同小异...

  • [『音频智能』] Voice Activity Detection(VAD)的过去时与现在时 日期:2021-05-13 13:53:25 点击:133 好评:0

    VAD 可应用于低码率编码静音段数据减少网络数据传输,要知道在语音通话中超过 60% 的数据是 silence。在语音增强领域,处理加性背景噪音最流行的方法之一是谱减法 spectral subtraction[1, 2]:...

  • [『音频智能』] 解码转换QQ微信的SILK v3编码音频为MP3或其他格式 日期:2021-01-30 16:24:19 点击:228 好评:0

    SILK v3编码是Skype向第三方开发人员和硬件制造商提供免版税认证(RF)的Silk宽带音频编码器,Skype后来将其开源。具体可见 Wikipedia 。 但是现在很难找齐源码,或者说懒得找。 一年前寻找的时候,...

  • [『音频智能』] AI技术之三:语音识别&翻译&自然语言处理 日期:2020-12-23 13:25:10 点击:149 好评:0

    当前技术:★★★★✰ 未来潜力:★★★✰✰ 应用落地:★★★★✰ 语音识别,翻译和自然语言处理其实是三种技术,但由于在场景中经常混用,放在一起更合适一点。 语音识别 语音识别领...

  • [『音频智能』] 专访沈向洋:人工智能泡沫很大 真正难的是落地 日期:2020-11-26 13:19:48 点击:194 好评:0

    会后,新浪数码专访了小冰公司董事长、原微软全球执行副总裁沈向洋和小冰公司首席执行官、原微软(亚洲)互联网工程院常务副院长李笛、微软公司副总裁、微软中国区首席运营官邹作基。...

  • [『音频智能』] google sdk speech-to-text(谷歌语音转文本、谷歌语音转 日期:2020-11-10 15:35:54 点击:308 好评:0

    google sdk speech-to-text 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。...

  • [『音频智能』] Avaya DMCC录音技术与原理 日期:2020-08-31 16:08:56 点击:366 好评:0

    Avaya DMCC录音技术与原理 Avaya DMCC Avaya DMCC录音解决方案是CyberTech和Avaya两家公司共同开发应用于基于Avaya 媒体服务器的联络中心的录音解决方案。DMCC全称Device Media Call Control (之前的版本称为...

栏目列表
推荐内容
织梦二维码生成器