信號處理
基于陣列與深度學(xué)習(xí)技術(shù),提供多場景高性能的人機(jī)語音交互與通話降噪功能。包括1mic、2mic、4mic、6mic、8mic及多種豐富陣型的遠(yuǎn)近場陣列處理方案,實(shí)現(xiàn)混響抑制、波束形成、回聲抵消、聲源定位、噪聲消除等。在Interspeech2021噪聲消除(DNS)與回聲消除(AEC Challenge)評測中均獲第二
語音喚醒語音識別
語音喚醒、語音識別
云知聲語音喚醒高時(shí)效、高喚醒率、低誤喚醒率,支持one-shot及自定義喚醒詞;語音識別技術(shù)安靜環(huán)境下通用領(lǐng)域識別率 >97%
聲紋識別
包含在線聲紋識別(可支持十萬級別聲紋庫快速檢索)和離線聲紋識別(響應(yīng)延遲小于 500 ms),理想場景下識別準(zhǔn)確率 >99%
面部識別
擁有全面自研的人臉信息分析能力,包括人臉檢測與矯正,屬性識別,人臉比對和搜索,多模態(tài)活體檢測等;針對性優(yōu)化復(fù)雜光照和遮擋場景,支持戴口罩人臉識別通行;在 MegaFace 等多個(gè)國際公開競賽中躋身第一梯隊(duì)水準(zhǔn)
OCR
多種通用場景的高精度全圖文字檢測和識別,包括各類印刷文檔、表格、票據(jù)、卡證等;總體識別準(zhǔn)確率達(dá)到 99%,具備離線和在線批量識別能力,可用于紙質(zhì)文檔電子化、辦公文檔/報(bào)表/票證識別等場景
發(fā)音評估
基于語音識別和評價(jià)技術(shù)對發(fā)音做客觀打分,反饋發(fā)音正誤和定位問題。依托先進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,云知聲口語評測的評測打分結(jié)果與人工專家打分?jǐn)M合度在 95% 以上,擁有細(xì)分年齡段引擎,可多維度輸出結(jié)果
語音合成
基于深度學(xué)習(xí)和端到端的語音合成技術(shù),可將文本實(shí)時(shí)、準(zhǔn)確地轉(zhuǎn)換為清晰、自然、流暢的語音,MOS 分可達(dá) 4.2,Blizzard Challenge 2020 多項(xiàng)關(guān)鍵指標(biāo)第一名。提供離線和在線合成,多音色可選,20-300 句音庫即可定制個(gè)性化音色
語音圖像融合
基于端到端的機(jī)器翻譯技術(shù),支持中-英、中-日、中-韓互譯,WMT 2018 英中翻譯第二名、中英翻譯第三名
語義理解
基于BERT的語義理解算法模型,少量訓(xùn)練語料即可達(dá)到92%的準(zhǔn)確率,CPU解碼耗時(shí)低于20ms;提供成熟的訓(xùn)練工具和閉環(huán)日志優(yōu)化方案,具備高效的工業(yè)級NLU落地應(yīng)用能力。公有語義云平臺擁有95個(gè)通用技能,平均語義理解準(zhǔn)確率94%
推理和決策
基于知識圖譜的對話管理方案,具備靈活準(zhǔn)確的流程驅(qū)動、省略指代消解和技能間跳轉(zhuǎn)切換能力,對話管理準(zhǔn)確率為98%;提供成熟的流程可視化拖拽編輯工具,具備高效的工業(yè)級對話流程設(shè)計(jì)與應(yīng)用能力
知識圖譜
大規(guī)模多源異構(gòu)知識圖譜構(gòu)建與應(yīng)用方案,具備低資源低成本知識抽取技術(shù)優(yōu)勢和敏捷構(gòu)建的標(biāo)準(zhǔn)流程,并提供知識圖譜全生命周期的管理平臺和應(yīng)用開發(fā)組件?;谥R圖譜核心技術(shù),《大規(guī)模知識圖譜構(gòu)建關(guān)鍵技術(shù)與應(yīng)用》項(xiàng)目獲得2019年北京市科技進(jìn)步一等獎(jiǎng);獲CCKS2020 醫(yī)療實(shí)體識別評測第一名、CHIP2019手術(shù)實(shí)體鏈接第一名
持續(xù)更新
機(jī)器學(xué)習(xí)算法
共享的前沿機(jī)器學(xué)習(xí)框架和算法,包括各種結(jié)構(gòu)的有監(jiān)督、輕監(jiān)督和無監(jiān)督學(xué)習(xí)方法,以及小樣本、遷移學(xué)習(xí)、增強(qiáng)學(xué)習(xí)、因果模型、可解釋性研究等,讓底層機(jī)器學(xué)習(xí)技術(shù)突破,能盡快在感知、生成和認(rèn)知技術(shù)方向上實(shí)現(xiàn)升級
智算集群(算力)
智算平臺(算力)
高性能計(jì)算平臺。面向人工智能計(jì)算場景,支持主流 AI 計(jì)算框架,高效彈性異構(gòu)計(jì)算與 PB 量級高性能海量存儲,峰值計(jì)算能力達(dá)到八億億次每秒,提供私有化部署,助力用戶提升 AI 計(jì)算效率
大數(shù)據(jù)平臺(算據(jù))
自研人工智能大數(shù)據(jù)平臺,包含數(shù)據(jù)獲取、數(shù)據(jù)標(biāo)注與處理、數(shù)據(jù)治理、數(shù)據(jù)隱私與安全四大功能,具備處理 PB 級多模態(tài)數(shù)據(jù)的能力,助力人工智能算法升級迭代
1、中科院自動化所、CMU、西工大、上師大等產(chǎn)學(xué)研合作、聯(lián)合實(shí)驗(yàn)室及人才培養(yǎng)基地
2、中醫(yī)科學(xué)院等產(chǎn)業(yè)應(yīng)用聯(lián)合實(shí)驗(yàn)室