在人工智能的浪潮中,語料數據如同建筑的基石,其質量、規模和運用策略直接決定了AI模型的表現和應用的廣泛性。
景聯文科技在AI領域深耕多年,打磨了高質量多模態數據集,致力于為不同訓練階段的算法精準匹配高質量數據資源。
3000萬張圖像數據集
數據詳情:3000萬張圖像,圖像內容來源于真實世界;圖像內容合法合規,不涉及敏感數據。
圖片規格:7680*4320以上,長寬比∈[0.5,2],PNG、JPG格式。
圖像質量:紋理細節豐富;圖像信噪比高,噪聲低;圖像無水印;風格真實,色調自然;圖像內容干凈無歧義;構圖較好,美感較好;圖像邊緣不出現黑框、白框,圖像非黑白照;圖像非拼圖或合成圖,純色背景(影棚)不超過1%。
場景多樣性:覆蓋場景包括動物,植物,建筑,建材,靜物,食物,人像; 動物,植物,建筑,建材,靜物,食物,人像類別占比超過80%,且各個類別分布相對均勻。
光照條件:正常光照條件下(非陰天、逆光、夜景)拍攝的圖像,或者攝影專用燈光環境下拍攝圖片。
圖像標簽:提供圖像的場景描述/內容主體類別描述;光照分類標簽;提供拍攝信息描述:拍攝角度(例如微距特寫,廣角、正面、側拍、俯拍等);提供相機參數描述,包含光圈信息(f14,f16,f22等),濾鏡信息(漸變濾鏡,色彩濾鏡,UV濾鏡等),曝光信息(雙重曝光,多重曝光等),焦段信息(24mm,35mm等)等,exif信息不做強制要求。
100萬條特寫視頻數據集
數據數量:100萬條視頻
數據格式:短邊分辨率≥1080P,mp4、mkv格式。
數據多樣性:
1)人物:全身/半身/臉部表情特寫
2)風景:自然景觀、氣候
3)動物:萌寵、動物特寫、類似《動物世界》
4)植物:植物生長、微距鏡頭、昆蟲
5)建筑:人文建筑運鏡
100萬條航拍視頻數據集
數據詳情:100萬條視頻
1)俯拍視角數據:自然風景、城市人文風景
2)跟隨環繞畫面
3)無人機及穿越機穿梭視角數據
數據格式:短邊分辨率≥1080P,mp4、mkv格式。
畫面內容:??
1.有鏡頭語言:推、拉、搖、移、升、降、跟隨、環繞、變焦等大幅度運鏡,畫面流暢無抖動。
2.光線充足不欠曝或過曝,噪聲低,畫質銳利,色彩正確(非黑白無偏色)。
???
200萬條虛擬渲染視頻
數據詳情:200萬條視頻
數據格式:短邊分辨率≥1080P,mp4、mkv格式;
畫面內容:?
1.非固定視角,視角環繞人物(人物靜止、人物運動)、視角跟隨人物 (第三人稱);物體/場景:視角環繞物體、視角在場景中穿梭。
2.光線充足不欠曝或過曝,噪聲低,畫質銳利,色彩正確(非黑白無偏色)。
在數據安全與合規方面,景聯文科技已通過ISO9001質量、ISO27001信息安全、ISO27701國際隱私安全管理認證,積極參與8項國家數據交換格式和數據安全標準制定,牢固構筑數據保護的基石。
獲取樣例請登錄景聯文科技官網咨詢客服。https://www.jinglianwen.com/ai/
或直接發送需求至郵箱:lx@jinglianwen.com
景聯文科技|數據采集|數據標注|多模態數據集
助力人工智能技術,賦能傳統產業智能化轉型升級
文章圖文著作權歸景聯文科技所有,商業轉載請聯系景聯文科技獲得授權,非商業轉載請注明出處。