合作咨詢
信號處理
信號處理
基于陣列與深度學習技術,提供多場景高性能的人機語音交互與通話降噪功能。包括1mic、2mic、4mic、6mic、8mic及多種豐富陣型的遠近場陣列處理方案,實現混響抑制、波束形成、回聲抵消、聲源定位、噪聲消除等。在Interspeech2021噪聲消除(DNS)與回聲消除(AEC Challenge)評測中均獲第二
了解詳情人臉識別
人臉識別
擁有全面自研的人臉信息分析能力,包括人臉檢測與矯正,屬性識別,人臉比對和搜索,多模態活體檢測等;針對性優化復雜光照和遮擋場景,支持戴口罩人臉識別通行;在 MegaFace 等多個國際公開競賽中躋身第一梯隊水準
了解詳情OCR
OCR
多種通用場景的高精度全圖文字檢測和識別,包括各類印刷文檔、表格、票據、卡證等;總體識別準確率達到 99%,具備離線和在線批量識別能力,可用于紙質文檔電子化、辦公文檔/報表/票證識別等場景
了解詳情口語測評
口語評測
基于語音識別和評價技術對發音做客觀打分,反饋發音正誤和定位問題。依托先進的神經網絡算法,云知聲口語評測的評測打分結果與人工專家打分擬合度在 95% 以上,擁有細分年齡段引擎,可多維度輸出結果
了解詳情語音合成
語音合成
基于深度學習和端到端的語音合成技術,可將文本實時、準確地轉換為清晰、自然、流暢的語音,MOS 分可達 4.2,Blizzard Challenge 2020 多項關鍵指標第一名。提供離線和在線合成,多音色可選,20-300 句音庫即可定制個性化音色
了解詳情語義理解
語義理解
基于BERT的語義理解算法模型,少量訓練語料即可達到92%的準確率,CPU解碼耗時低于20ms;提供成熟的訓練工具和閉環日志優化方案,具備高效的工業級NLU落地應用能力。公有語義云平臺擁有95個通用技能,平均語義理解準確率94%
了解詳情知識圖譜
知識圖譜
大規模多源異構知識圖譜構建與應用方案,具備低資源低成本知識抽取技術優勢和敏捷構建的標準流程,并提供知識圖譜全生命周期的管理平臺和應用開發組件?;谥R圖譜核心技術,《大規模知識圖譜構建關鍵技術與應用》項目獲得2019年北京市科技進步一等獎;獲CCKS2020 醫療實體識別評測第一名、CHIP2019手術實體鏈接第一名
了解詳情大規模機器學習架構
大規模機器學習架構
共享的前沿機器學習框架和算法,包括各種結構的有監督、輕監督和無監督學習方法,以及小樣本、遷移學習、增強學習、因果模型、可解釋性研究等,讓底層機器學習技術突破,能盡快在感知、生成和認知技術方向上實現升級
了解詳情智算平臺(算力)
智算平臺(算力)
高性能計算平臺。面向人工智能計算場景,支持主流 AI 計算框架,高效彈性異構計算與 PB 量級高性能海量存儲,峰值計算能力達到八億億次每秒,提供私有化部署,助力用戶提升 AI 計算效率
了解詳情1、中科院自動化所、CMU、西工大、上師大等產學研合作、聯合實驗室及人才培養基地
2、中醫科學院等產業應用聯合實驗室