专注于音视频处理及流媒体开发!

罗索

  • [『音频智能』] 解码转换QQ微信的SILK v3编码音频为MP3或其他格式 日期:2021-01-30 11:23:14 点击:176 好评:0

    SILK v3编码是Skype向第三方开发人员和硬件制造商提供免版税认证(RF)的Silk宽带音频编码器,Skype后来将其开源。具体可见 Wikipedia 。 但是现在很难找齐源码,或者说懒得找。 一年前寻找的时候,...

  • [『音频智能』] AI技术之三:语音识别&翻译&自然语言处理 日期:2020-12-23 13:25:10 点击:129 好评:0

    当前技术:★★★★✰ 未来潜力:★★★✰✰ 应用落地:★★★★✰ 语音识别,翻译和自然语言处理其实是三种技术,但由于在场景中经常混用,放在一起更合适一点。 语音识别 语音识别领...

  • [『音频智能』] 专访沈向洋:人工智能泡沫很大 真正难的是落地 日期:2020-11-26 13:19:48 点击:176 好评:0

    会后,新浪数码专访了小冰公司董事长、原微软全球执行副总裁沈向洋和小冰公司首席执行官、原微软(亚洲)互联网工程院常务副院长李笛、微软公司副总裁、微软中国区首席运营官邹作基。...

  • [『音频智能』] google sdk speech-to-text(谷歌语音转文本、谷歌语音转 日期:2020-11-10 15:35:54 点击:248 好评:0

    google sdk speech-to-text 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。...

  • [『音频智能』] Avaya DMCC录音技术与原理 日期:2020-08-31 16:08:56 点击:278 好评:0

    Avaya DMCC录音技术与原理 Avaya DMCC Avaya DMCC录音解决方案是CyberTech和Avaya两家公司共同开发应用于基于Avaya 媒体服务器的联络中心的录音解决方案。DMCC全称Device Media Call Control (之前的版本称为...

  • [『音频智能』] ALLEN & HEATH推出支持AES67标准的最新版本M-Dante音频 日期:2020-08-27 13:45:22 点击:228 好评:0

    Allen & Heath宣布最新版本的M-Dante音频网卡支持AES67标准,该网卡为Audinate Dante网络提供了一个64x64接口,可安装在GLD、dLive、ME和iLive数字混音系统中。...

  • [『音频智能』] PocketSphinx语音识别系统的编译、安装和使用 日期:2020-08-14 18:04:28 点击:181 好评:0

    PocketSphinx 语音识别系统的编译、安装和使用 zouxy09@qq.com http://blog.csdn.net/zouxy09 Sphinx 是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。 Sphinx 从开发之初就得到了...

  • [『音频智能』] 静音检测VAD算法 日期:2020-08-07 13:41:22 点击:128 好评:0

    最近把opus编码器里的VAD算法提取了出来,之前在网上没找到合适的开源VAD模块,就把代码放在这里吧,希望能帮助到人。...

  • [『音频智能』] 利用ffmpeg的filter混音 日期:2020-08-05 13:11:34 点击:87 好评:0

    一个简单的混音demo,把文件a和文件b的音频混为一个音频流输出并存为文件,只处理每个文件的第一个音频流 注:源代码是网友Larry_Liang(1085803139)写的,我帮其调试通过,存在这里以免备忘...

  • [『音频智能』] 如何利用Matlab产生单音信号 日期:2020-08-04 18:43:57 点击:254 好评:0

    单音信号,既单一频率的信号,在测试IFFT/FFT正确性时,我们常常用到单音信号,一般需要的单音信号时是复数形式; fm = 2e6 ; %信号频率 fs = 122.88e6; %采样速率 w = 2*pi*fm; dt = 1/fs; t = 0:dt:dt*32...

栏目列表
推荐内容
织梦二维码生成器