湖南快3人工预测-辽宁朝阳新闻
点击关闭
您现在的位置双辽新闻首页>>综合新闻>>正文

引入任意-文字检测与识别技术在实际生活中有广泛的应用

男孩跳绳1秒超7次

【編輯:于曉】

在本次任務中,搜狗採用了基於實例分割的文字檢測方法,訓練及測試過程中引入了掩碼融合、打分機制優化、多尺度等技術。針對文字識別,搜狗以主流的Encoder-Decoder技術作為框架,以SE-ResNet作為Encoder骨幹網絡,引入薄板樣條插值算法(TPS)和通道注意力機制(Channel-Attention),創新性地將殘差思想引入多層Bi-LSTM中,不同層的LSTM特徵通過殘差連接進行特徵融合,增強了模型的魯棒性。在Decoder模塊中,採用注意力解碼機制實現對特徵解碼識別。

11月8日電 近日,搜狗在OCR識別權威比賽ICDAR2019挑戰中,刷新了任意形狀文字識別(ArT)中檢測、識別、端到端三項任務的新記錄,充分體現了搜狗在文字識別領域的領先優勢。

搜狗此次刷新ICDAR2019-ART榜單的成績,是其在OCR領域持續耕耘的結果,也是在AI領域的能力體現。未來,搜狗還將不斷擴展技術成果的落地場景,帶給用戶更多切實便利及驚喜體驗。

文字檢測與識別技術在實際生活中有廣泛的應用,如掃描錄入、拍照搜題、拍照翻譯、路標識別等。搜狗OCR技術在眾多垂直領域落地,滿足着廣大用戶多樣化、個性化需求,幫助用戶提升輸入的效率,在搜狗翻譯及輸入法等產品中得到用戶的廣泛使用和好評,並同時為vivo等合作夥伴賦能。

ICDAR國際文檔分析與識別比賽是圖像領域文本檢測與識別的權威賽事,備受業界關注。ICDAR2019-ArT是在2019年提出的新任務,因其任務的高挑戰性,吸引了曠視、華為、阿里等傳統強隊參与。與往年的賽事任務不同的是,2019年的數據集旨在推動任意形狀文字檢測和識別技術的發展與創新,因此數據層面聚焦在任意形狀,特別是不規則場景文字的檢測與識別,這就要求算法框架具有更高的魯棒性。而且,該數據集為自然場景圖像,場景類型覆蓋面大、背景複雜,同時存在大量非規則形狀文字,是目前業界最大的任意形狀場景文字數據集,複雜性和難度更大。

今日关键词:玻利维亚总统辞职