近日,靈云語音合成SDK、譯圖智訊OCR SDK、易道博識SDK等66款人工智能類SDK已完成對鴻蒙5的適配。這些SDK覆蓋語音合成與識別、光學字符識別、圖像增強與處理等多個人工智能核心領域,有效幫助鴻蒙開發者快速集成多項先進AI能力,從而更專注于產品創新與用戶體驗提升。
• 靈云語音合成SDK
靈云語音合成SDK可將文本實時、準確地轉換為自然、流暢的語音,并提供男聲、女聲、童聲等多種合成音色,支持中文普通話、粵語、維語、英語、日語等60多種語言,并為用戶提供定制化的語音合成服務。此外,該SDK的普通話識別準確率高達98%,支持普通話、英語、粵語、維吾爾語、客家話等多種語言,具備很強的口音普適性,用戶還可自由定制垂直領域的語音識別模型,識別效果更精確。
靈云SDK已在移動應用、智能客服、智能家電、智能車載、機器人等眾多領域廣泛應用。在移動應用領域,服務京東商城、滴滴打車、高德地圖等眾多知名應用;在智能車載領域,實現智能車載輸入法、智能語音導航、車輛控制等功能;在服務類機器人領域,助力眾多機器人廠商實現智能交互與精準交流;在智能家居領域,讓家電設備實現遠場語音控制與人臉、聲紋識別等智能化服務。
• 譯圖智訊OCR SDK
譯圖智訊OCR SDK基于移動端深度學習框架,構建起覆蓋個人證照識別、車輛證件識別、企業證照識別、圖像分類、印章檢測、通用識別等20個垂直場景的OCR產品矩陣,可以幫助應用快速、準確地從圖像中提取文字信息,并將其轉換為可供編輯和處理的文本格式。
通過輕量化的設計架構,譯圖智訊OCR SDK實現三大核心技術突破:1、極速響應:證卡識別響應速度最快可達200ms/張,復雜場景識別準確率達99.6%;2、超輕體量:SDK增量體積壓縮至10MB以下,降低內存占用負載;3、智能適配:模塊化架構支持功能組件自由組合,縮短定制開發周期。目前,譯圖智訊OCR SDK已在多家銀行金融單位落地應用,為客戶提供豐富、便捷、安全的產品體驗。
• 微幀移動端超分增強SDK
該SDK基于AI圖像優化算法,對視頻進行實時智能超分辨率、色彩增強、畫質修復處理,已被咪咕視頻等應用集成,為用戶提供了更高清的視頻觀看體驗。
• 易道博識SDK、合合OCR SDK
兩款SDK皆服務于中信證券、蜻蜓點金、廣發基金、浦大喜奔、陸基金等頭部金融理財應用,以及韻達快遞等物流類應用,使用戶體驗更加便捷高效。
目前,已有即時通訊類、認證類、媒體類等21類伙伴的780余款SDK適配鴻蒙5,而隨著近百款人工智能類SDK的全面適配,越來越多的鴻蒙應用將在語音交互、圖像識別、視頻增強等AI核心應用場景實現體驗升級。期待在未來,隨著更多鴻蒙開發者和合作伙伴加入鴻蒙生態,智能化能力邊界將持續擴展,為多行業場景注入更高效、更智能的創新體驗。