InterSystems通過矢量搜索擴展了InterSystems IRIS數據平臺,支持下一代人工智能應用
2024年3月26日,InterSystems數據平臺全球主管Scott Gnau發文,宣布InterSystems IRIS數據平臺新增了矢量搜索(vector search)功能。
人工智能具備變革性潛力,能夠從數據中獲取價值和洞察力。我們正在邁向一個幾乎所有應用都將通過人工智能來驅動的世界,隨之而來的,是構建這些應用的開發人員需要正確的工具從這些應用中創造體驗。因此,InterSystems非常高興地宣布這一消息——IRIS數據平臺新增了矢量搜索(vector search)功能。
在使用大型語言模型時,像矢量搜索這樣的工具對于從海量數據集中高效、準確地檢索相關信息至關重要。通過將文本和圖像轉換為高維矢量,這些技術可以支持快速比較和搜索,即便處理分散在整個組織、不同數據集的數百萬個文件時也是如此。
InterSystems IRIS數據平臺為下一代應用提供了統一基礎
在InterSystems,我們始終在探尋各種方式,使下一代數據處理盡可能地離客戶數據近一些,而無需將數據傳輸到特定系統。將矢量搜索功能添加至InterSystems IRIS數據平臺后,我們可以通過矢量嵌入(vector embedding)對數據平臺進行搜索,從而增強軟件在自然語言處理(NLP)、文本和圖像分析相關任務中的功能。這種集成將使開發人員能夠更輕松地創建使用生成式人工智能的應用程序,以完成各種用例的復雜任務,并根據InterSystems處理的專有數據(proprietary data)提供即時響應。這也意味著他們可以使用精巧的矢量化索引來完成這項工作,同時對保持內部專有產權情報的安全充滿信心。
這一功能支持InterSystems IRIS數據平臺管理和查詢內容及相關的密集矢量嵌入,特別是能夠與RAG集成,開發基于生成式人工智能的應用。隨著可用工具集的快速發展,無縫RAG集成可支持新模型和用例的敏捷采用。
這項技術能夠給客戶帶來哪些益處?
BioStrand是一家依賴于人工智能的藥物發現公司,也是InterSystems創新計劃(InterSystems Innovation Program)的一部分(該計劃幫助初創企業在我們的IRIS平臺上構建應用)。BioStrand的核心產品是Lensai平臺,這是一種多功能解決方案,支持包括抗體藥物發現和設計在內的各種應用。通過先進的算法,Lensai可以迅速識別并設計新型藥物化合物,大大縮短了從開發到商業化的研發時間。該模型將采用先進堆疊技術的大型語言模型(LLM)的優勢與BioStrand的專利技術HYFT獨特地結合在一起。
HYFT是一種嵌入類型,在生物序列中充當獨一無二的“指紋”,使BioStrand能夠高精度地分配來自不同LLM的嵌入。這個基礎模型代表著一個龐大且不斷擴展的知識圖譜,在6.6億個數據對象中映射了250億種關系,令人印象深刻。這個全面的圖譜將整個生物圈的序列、結構、功能以及書目信息相互連接在一起。它還融合了檢索增強生成、SQL矢量搜索等尖端技術,以及LLM的生成能力和知識圖譜的語義表達能力。
矢量搜索將從根本上改變開發人員與IRIS的交互方式
在實施這項技術方面,我們還只是剛剛起步。隨著客戶與數據的交互方式因矢量搜索而得到改變,隨著新的人工智能應用不斷通過應用矢量搜索而得到開發,我們將分享更多客戶故事。與此同時,我也推薦您訪問我們的矢量搜索頁面,了解更多信息(https://www.intersystems.com/vectorsearch/)。
我們加速創新,確保客戶成功,并展示對卓越的承諾,與此同時,我們致力于維護最高標準的隱私、安全和責任,這將引導我們以一種深思熟慮、公正的方式對待人工智能,從而創造信任。我們相信,透明度、責任感和可解釋性是建立對人工智能系統的信任并推動其創新的關鍵。
(本文作者:Scott Gnau,InterSystems數據平臺全球主管)
點擊此處可查看InterSystems矢量搜索頁面
(本文由InterSystems公司供稿)