貨拉拉成立于2013年,成長于粵港澳大灣區,是從事同城跨城貨運、企業版物流服務、搬家、零擔、跑腿、冷運、汽車租售及車后市場服務的互聯網物流商城。截至2024年,貨拉拉在全球擁有1670萬月活用戶和168萬月活司機,業務覆蓋全球11個市場、400+城市,并在全球設有6個數據中心。
一、大模型應用場景的挑戰
貨拉拉基于自身在物流領域 AI 落地的深厚積累,已在 14+ 個業務或部門,50+ 個真實業務場景探索和落地大模型應用。在引入大模型的過程中,面臨著其在垂直領域知識的缺乏、時效性不足以及數據安全隱患等挑戰。為應對這些問題,采用了業界較為通用的解決方案的解決方案——檢索增強生成技術(Retrieval-Augmented Generation, RAG),通過引入外部數據,讓大模型的回答從原來的“閉卷”變為“開卷”。RAG 通過整合領域專有知識、私有數據以及實時數據,顯著降低了答案生成的不確定性,增強了數據安全性,從而有效解決了大模型的固有問題,提升了回答的準確性和實用性。
RAG 的核心在于將強大的語言模型能力與向量數據庫的能力相結合,企業在實施 RAG 方案的過程中,通常需要結合一個向量數據庫。向量數據庫在處理多模數據和語義檢索方面具有獨特的優勢,具體體現在以下幾個方面:
存儲非結構化數據:向量數據庫能夠有效存儲和管理多模態數據,如音頻、視頻、圖片和文本等。這些數據通常具有規模龐大、信息密度高、處理成本高的特點。
向量化表示:通過神經網絡提取數據特征,將其轉換為高維空間中的坐標點。向量化表示賦予數據語義表達能力,使其適用于相似性檢索。
檢索非結構化數據:通過計算向量間的距離(如內積或歐氏距離),識別出最相似的向量。檢索過程涉及近鄰圖的遍歷,需要進行大量的浮點運算,以實現高效的相似性匹配。
二、向量數據庫選型思考
(一)原有架構與痛點
現有的架構包含基礎設施層(CPU 和 GPU 兩種機型)、存儲層(向量數據庫、ES等)、檢索層(以圖索引為主,多種檢索類型)、接入層與入口層。并且在國內外共有 5 個集群,單集群內存配置在 380 +GB,單表數據量最大為2000萬。
痛點1:動態 schema
隨著業務的快速發展,頻繁的字段增刪操作成為常態。目前的解決方案是通過新建表、導入現有數據并最終重建索引來實現,這一流程相對繁瑣。對于某些數據量較大的表,索引重建的耗時可能長達十幾個小時。此外,索引重建過程對 CPU 和內存資源消耗極大,容易引發線上業務抖動。
痛點2:混合檢索
向量檢索在相似語義檢索和多模態數據理解方面具有顯著優勢,而全文檢索則在精準匹配、短文本及低頻詞匯檢索上表現優異。在企業應用中,僅依賴單一檢索方式難以滿足業務對檢索精度的高要求。為了彌補全文檢索的缺陷,引入了Elasticsearch來作為全文檢索引擎,這也導致了整體架構的復雜性增加,同時提升了系統的維護難度。對于用戶而言,需要在應用層實現復雜的reranking邏輯,并且得到的相似度得分難以統一,從而增加了使用成本。因此,業務希望引入一站式混合索引能力。
痛點3:運維難度大
穩定性能力弱:向量數據庫本身存在不穩定性,BUG 較多;缺乏專家經驗使得問題排查變得困難;監控指標有限,問題定位困難。
擴展性不足:節點的橫向擴展能力較差,數據遷移依賴人工;數據分片的管理和運維過程復雜。
權限認證能力弱:現有的權限認證機制不夠完善,容易引發數據泄漏和安全問題,需要自行實現權限管理,增加了開發和運維的復雜性。
社區活躍度差:雖然項目仍在維護,但更新頻率較低,社區貢獻和開發者參與度有限,且社區功能和生態發展緩慢,無法滿足業務未來的需求。