尊敬的用戶:
本周迎來容聯AI Call產品又一次更新,本次更新重點豐富自學習平臺的功能,旨在讓運營更智能,提高運營整體工作效率,實現【數據自動打標】,自動將原始數據進行數據清洗、數據標注、數據分類,有效縮短了數據標注工期。同時,打破傳統測試集數據手動拆分方式,實現【測試集數據自動提取】,數據提取更科學,評測結果更真實。
如下為V5.1.1本次更新內容:
升級說明
1、打通線上「數據集」一體化流程
數據集上傳、模型訓練、模型評測、模型發布和解綁,都可以在自學習平臺完成,打通線上數據集管理、模型訓練、模型評測、模型發布一體化流程。
2、數據自動打標功能
針對海量數據,通過人工對數據進行標注,無法保證高效的完成數據清洗標注以及數據分類。本次自學習平臺新增數據自動打標動能,僅需上傳原始數據集文件,系統按照配置策略,自動將原始數據進行數據清洗、數據標注、數據分類,人工僅需完成簡單的復檢,即可將數據用于模型訓練,有效縮短了數據標注工期。
3、模型訓練更靈活
本次在模型訓練任務上增加了任務排隊機制,支持取消訓練,在面對大量模型訓練任務時,可以更好的承載超大并發量的模型訓練任務,從而提升模型訓練的效率。
4、測試集數據自動提取
過去的測試集數據是在訓練集數據中通過手動的方式進行拆分,耗時耗力,如果數據拆分不均勻,還可能導致最終模型效果不佳、評測結果存在偏差。本次迭代打破傳統方式,僅需在模型訓練時,選擇所需訓練集文件,系統自動按照訓練集標簽數量提取一定比率的測試集數據出來,數據提取更科學,評測結果更真實。
5、支持意圖、多意圖、情感、句式識別模型評測
在模型評測方面,本次新增單意圖、多意圖、情感、句式識別的模型評測結果輸出,同時我們還對模型評測的指標計算方式進行調優處理,使模型結果數據評測更加精準有效。
6、內置通用模型數據,全平臺可使用
結合容聯在數據上的沉淀積累,容聯將百萬級數據通過清洗整理,并訓練成行業場景的通用模型,盡可能實現開箱即用,減低冷啟環節的耗時。本次更新容聯將這些模型開放出來,可供全平臺的租戶使用。
7、數據安全升級
本次數據安全升級主要從兩個方面進行了全新升級,一方面對數據本身的安全加密,采用符合絕大部分客戶要求的密碼算法對數據進行主動保護,另一方面對數據防護的安全,采用信息存儲手段對數據進行主動防護。所有訓練平臺數據統一放入NAS目錄進行存儲。