電梯產業面臨這樣一個問題,因為太多的品牌,將近 400 多個,甚至有寶馬,奧迪,你敢相信,一家造汽車的造過電梯?不過好像想想也是,電梯是第二大交通工具,電梯從某種意義上來說,也是一部電梯,只不過是垂直的那種,而且現在的電梯已經發展到了可以橫著走的那種。
?正是因為品牌如此之多,所以遺留有大量的技術資料,可以大膽的說,目前沒有一個地方有全部電梯資料的,梯哥哥也沒有,但是我們梯哥哥可以不斷完善,完善接踵而來的是缺乏好的分類和總結,這個不僅僅需要大量的人工,而且需要大量的專業人士,一般人根本看不懂思密達,所以我想嘗試通過 ai,看看能不能幫助我們梯哥哥解決這個難題,幫助廣大的電梯人朋友在第一時間就能知道這個文件的大概內容,是不是他想要的,節省他們時間,真正做到降本增效!
這個就面臨著如何選擇 ai。首先,選擇成熟模型還是自建,這個取決于成本效益比,目前來看這個自建肯定是不可取的,其次就是選擇哪一家,這個文件一般都很大,有的甚至幾百兆,目前來說只有 kimi 能夠處理長文本還能勉強試用。
上傳資料可選擇,可提供按鈕進行操作
https://platform.moonshot.cn/docs/api/files#%E8%B0%83%E7%94%A8%E7%A4%BA%E4%BE%8B
目前先做試驗,看看上傳文件能否提取正確。
下面是對 kimi 的試用報告。
一.接口方式
文件上傳順利,無堵塞 單文件上傳50M都可以
50M的文件內容提取后 文本大小90K左右 存在重復 無用數據
存在問題:
a)? ?沒有處理里面的亂碼等特殊內容
b)內容整理的也差強人意
例如:下圖 第檔 重復出現,內容也需要重新整理
二.網頁方式
通過網頁版 先上傳文件 然后提取核心內容。
結論:
a) 確實可以提煉核心內容,但是需要反復在網頁操作繁瑣
b)?存在問題 解析文件不穩定 會出現解析失敗
c)?解析內容同樣不如人意;
最后總結
1)通用型模型提取文件內容作用不大,提取出來的內容需要重新整理;
2)自己搭建模型,需要的成本太高,目前還不成熟,不適合商用;