用大模型搭建一個自己的新聞小助手

背景

信息快速增長的時代,及時獲取到有價值的資訊是一件很必要的事情。已經有各類新聞app和獲取信息的渠道了,為什么還需要在構建一個小助手來獲取新聞資訊呢?其實原因很簡單各類新聞app服務的是具體一類人群,個人和人群還是有偏差的。如果可以根據自己的需要簡單的定制自己的新聞出版獲取器不是一件很有意思的事嗎。那么這個簡單有簡單到什么程度呢?為什么這么問呢,因為簡單必然是要付出精度代價的。但是大模型的出現很多復雜的是變得更簡單了,原因就是模型把做事流程做了抽象挖掘到更多更本質的或者更上層元策略。所以理論講你可以既簡單但又獲得更多有價值的信息。
一下假設我們希望我們的新聞小助手具備幾種能力(能力可分層,這一階段有可能部分能力達不到要求)。
1.新聞獲取能力:可以根據用戶需要搜索到新聞,并對新聞資訊做簡單整理
2.新聞摘要、解讀、分類
3.可以得到的這么多類新聞做匯總可視化(比如用xmind方式成綱領)
4.可以把內容讀取出來:新聞摘要、用戶喜歡的新聞成篇讀出
5.可以對新聞做深度解析,基于原文+關鍵詞檢索對信息作更全面的分析結構化解讀(這一步到后面文章介紹)
這篇文章選擇用字節開放的“扣子”編排工具來實現,DIfy、autoagent、chatglm、langflow理論上講都可以實現。但是扣子目前提供的工具插件、以及工作流我覺得是比較容易上手的。并且很多插件是免費使用、把各種API使用需要的權限申請和配置問題解決了。所以這次實踐選擇用“扣子”來實現。

實現

1.創建Bot

進入扣子頁面,點擊“創建Bot”,給應用起好名字、做好描述,點擊下一步就可以
image.png

2.Bot工作流構建

A.設定好人設與邏輯編排,這部主要是安排好助手指責、做事流程(比如我這邊就是給了他兩個角色:“提供新聞”、“新聞可視化”),具體要求可以參考下面圖(或者可以大概讓ai優化格式化指令)
b.設定流程調度的大模型,目前扣子只提供了三個選項:豆包、千問-max、minmax6.5但是長度是限制咋4k(感覺是不夠用的,選擇的模型效果不算事最好的),這邊我是選擇了Minmax6.5s 4k,豆包感覺對流程指令遵循能力不算好,千問-max給的指令長度不太夠(其實千問系列有更長指令的)
c.構建兩個分支工作流:新聞檢索、新聞可視化

image.png

3.新聞檢索工作流

image.png
這部分包括4道工序:
1.獲取當前時間,根據用戶需要查資訊時間推導出資訊查詢周期
2.對用戶的查詢query分析生成適合新聞檢索的query
3.用插件:“頭條新聞”、“搜狐新聞”來實現新聞檢索(這邊你也可以用bing、百度搜索、谷歌duckduckgo、秘塔…其他插件實現,我選擇的兩個插件不一定是最好的)
4.對檢索到的新聞用大模型做簡單加工格式化,抽標題、url、摘要、解讀(淺)
根據用戶輸入生成檢索query的prompt設置:

任務:生成包含用戶輸入的時間和問題的檢索詞。1. 解析輸入的時間格式(YYYY-MM-DD HH:MM:SS),例如 "2024-05-28 06:57:21"2. 根據輸入時間推算出目標時間段,例如推算出一周內的時間段為 "2024-05-21至2024-05-28"3. 組合用戶的query和推算出的時間段生成檢索詞。示例:
輸入時間:"2024-05-28 06:57:21"
用戶輸入的query:"最新的科技新聞"任務步驟:
1. 解析輸入時間→"2024-05-28 06:57:21"
2. 推算1周時間段→"2024-05-21至2024-05-28"
3. 生成檢索詞→"2024-05-21至2024-05-28 最新的科技新聞"請根據以上步驟生成檢索提示詞:
檢索詞:"[推算出的時間段] 用戶輸入的query"
用戶輸入:當前日期是{{current}},用戶輸入的時間{{day}};用戶輸入的query是{{query}}
只輸出[推算出的時間段] 用戶輸入的query

新聞簡單加工和格式化prompt設置:

請從下面的用戶輸入中提取并格式化每條新聞的名稱、url,并判斷新聞屬于什么類。要求如下:
1. 將每條新聞單獨列出,名稱、url和類別分別輸出。
2. 新聞名稱:直接摘錄內容,不需要做任何改動。
3. url:從提供的鏈接中提取,不需要修改。
4. 類別判斷:根據新聞簡介內容,判斷其主要涉及的關鍵詞。例如,如果新聞涉及健康、醫學研究,判斷其為“健康”。如果涉及宇宙、天文,判斷其為“天文”。
5.輸出的新聞標題,基于summary提取,不要用輸入的"title"
6.并對每條新聞作出解讀
7. 根據輸入格式化并分類新聞條目,最終結果以 JSON 格式輸出。
示例輸入:

sitename : williamzhang51
summary : 1. 腦損傷揭示慷慨路徑:一項研究表明,腹內側前額葉皮層(vmPFC)在我們的幫助他人的意愿中起著關鍵作用。2. 微塑料入侵:新墨西哥大學的研究人員在人體和犬類的睪丸組織中發現了微塑料,提出了對生殖健康的擔憂。3. 哈勃探索宇宙奇觀:哈勃望遠鏡探索了處于處女座星系團的棒狀螺旋星系NGC 4731,展示了其詳細的顏色和結構。4. 新型冠狀病毒可能引發下一次大流行:5. NASA的歐羅巴探測器準備發射:6. 納米級3D映射揭示大腦結構革命性見解:7. 量子計算進展:8. 綠色科技:9. 平臺工程:
title : 2024年5月28日科技新聞 1
url : http://m.toutiao.com/group/7373817664730300978/

示例輸出:

[
{
“title”: “腦損傷揭示慷慨路徑”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新聞解讀”:“腦損傷揭示慷慨路徑: 一項研究表明,腹內側前額葉皮層(vmPFC)在我們的幫助他人的意愿中起著關鍵作用。”
},
{
“title”: “微塑料入侵”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新聞解讀”:微塑料入侵: 新墨西哥大學的研究人員在人體和犬類的睪丸組織中發現了微塑料,提出了對生殖健康的擔憂。"
},
{
“title”: “哈勃探索宇宙奇觀”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “天文”,
“新聞解讀”:“哈勃探索宇宙奇觀: 哈勃望遠鏡探索了處于處女座星系團的棒狀螺旋星系NGC 4731,展示了其詳細的顏色和結構。”
},
{
“title”: “新型冠狀病毒可能引發下一次大流行”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “健康”,
“新聞解讀”:“新型冠狀病毒可能引發下一次大流行”
},
{
“title”: “NASA的歐羅巴探測器準備發射”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “天文”,
“新聞解讀”:“NASA的歐羅巴探測器準備發射”
},
{
“title”: “納米級3D映射揭示大腦結構革命性見解”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “科學技術”,
“新聞解讀”:“納米級3D映射揭示大腦結構革命性見解”
},
{
“title”: “量子計算進展”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “科學技術”,
“新聞解讀”:“量子計算進展”
},
{
“title”: “綠色科技”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “環境”,
“新聞解讀”:“綠色科技”
},
{
“title”: “平臺工程”,
“url”: “http://m.toutiao.com/group/7373817664730300978/”,
“category”: “技術”,
“新聞解讀”:“平臺工程”
}
]

用戶輸入{{input1}}、{{input2[0]}}

4.新聞可視化工作流image.png

包括兩道工序:
a.把檢索回來已經簡單加工的新聞資訊做進一步的加工,適配treemind呈現格式
b.把大模型進一步加工好的數據輸入給插件“TreeMind”來做可視化
大模型加工這邊選擇是Minmax6.5s(256k),指令如下:

Generate a mind map in xmind format from the following data. The mind map should be organized with top-level nodes as categories and under each category, include the articles as sub-nodes with their titles and URLs:Data:
[{"category":"健康","title":"腦損傷揭示慷慨路徑","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"健康","title":"微塑料入侵","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"天文","title":"哈勃探索宇宙奇觀","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"健康","title":"新型冠狀病毒可能引發下一次大流行","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"天文","title":"NASA的歐羅巴探測器準備發射","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"科學技術","title":"納米級3D映射揭示大腦結構革命性見解","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"科學技術","title":"量子計算進展","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"環境","title":"綠色科技","url":"http://m.toutiao.com/group/7373817664730300978/"},{"category":"技術","title":"平臺工程","url":"http://m.toutiao.com/group/7373817664730300978/"}
]The mind map should look like this:- 健康
- Title: 腦損傷揭示慷慨路徑
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 微塑料入侵
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 新型冠狀病毒可能引發下一次大流行
URL: http://m.toutiao.com/group/7373817664730300978/
- 天文
- Title: 哈勃探索宇宙奇觀
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: NASA的歐羅巴探測器準備發射
URL: http://m.toutiao.com/group/7373817664730300978/
- 科學技術
- Title: 納米級3D映射揭示大腦結構革命性見解
URL: http://m.toutiao.com/group/7373817664730300978/
- Title: 量子計算進展
URL: http://m.toutiao.com/group/7373817664730300978/
- 環境
- Title: 綠色科技
URL: http://m.toutiao.com/group/7373817664730300978/
- 技術
- Title: 平臺工程
URL: http://m.toutiao.com/group/7373817664730300978/用戶輸入:{{input}}

TreeMind對信息可視化結果如下:
image.png
或者如下:
image.png
最終模型執行結果如下,可以讓機器給你讀新聞,可以實現xmind可視化、可以設定每天定時給你推送加工好的新聞。后面如果要做深度解讀可以再加一條鏈路。
image.png
根據你自己需要按上面格式輸入你想看的周期類別的新聞。
image.png
可以點選朗讀,讓機器給你讀新聞,如果你不想自己點也可以設定自動讀。輸入“新聞可視化”實現新聞的xmind格式呈現。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/17815.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/17815.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/17815.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

kafka-消費者組-發布訂閱測試

文章目錄 1、發布訂閱測試1.1、創建消費者4并指定組 my_group21.2、列出所有的消費者組1.3、查看 my_group2 組的詳細信息1.4、發送第六條消息accomplish1.4.1、查看 my_group1 組的詳細信息1.4.2、查看 my_group2 組的詳細信息 1、發布訂閱測試 接著上一篇點對點博客測試 kafk…

LabVIEW控制Trio控制器

將LabVIEW與Trio控制器結合,可以實現對復雜運動系統的控制和監測。以下是詳細的方法和注意事項: 一、準備工作 軟件安裝: 安裝LabVIEW開發環境,確保版本兼容性。 安裝Trio控制器的相關驅動程序和軟件,如Trio Motion …

出現 Transaction rolled back because it has been marked as rollback-only 解決方法

目錄 1. 問題所示2. 原理分析3. 解決方法1. 問題所示 用戶反饋的Bug如下所示: Transaction rolled back because it has been marked as rollback-only截圖如下: 瀏覽器終端同樣顯示: 2. 原理分析 錯誤表明,在事務的生命周期內,遇到了某個異常或條件,導致該事務被標記…

Shell編程中的循環語句和函數

一、for循環語句 當面對各種列表重復任務時,使用簡單的if語句已經難以滿足需求,這時就需要for循環語句。for語句的結構為: for 變量 in 取值列表 do 命令序列 done 使用for循環語句時,需要指定一個變量及取值列表,針對…

2、python環境的安裝-mac系統下

打開官網,downloads下邊有macOS,點擊: 選擇最新版本,點擊,進入下邊的頁面,一直往下滑,看到files中有個macOS的版本,點擊下載 點擊下載后是pkg的安裝包,點擊安裝。 一步步…

鴻蒙OS開發:【一次開發,多端部署】(app市場首頁)項目

一多應用市場首頁 介紹 本示例展示了應用市場首頁,頁面中包括Tab欄、運營橫幅、精品應用、精品游戲等。 本示例使用一次開發多端部署中介紹的自適應布局能力和響應式布局能力進行多設備(或多窗口尺寸)適配,保證應用在不同設備或…

藍橋杯第1022題 玩具蛇 基礎DFS C++ Java

題目 思路和解題方法 問題理解:此題要求找出將一條由16節正方形構成的玩具蛇放入4x4的方格中的不同方式數。每節蛇可以是直線或直角轉彎,且蛇的形狀需要完全覆蓋盒子里的16個格子,每個格子僅被蛇的一個部分占據。 狀態表示:使用一…

爺爺看了都會,打工人必備的摸魚AI神器!免費!

去年,AI技術無疑成為了最為引人注目的焦點,層出不窮的創新應用令人目不暇接。盡管許多人對這股AI熱潮的持久性持懷疑態度,但現實卻用事實給予了最有力的反駁。AI所展現出的強大生產力,足以令人刮目相看。 而今年以來,…

springboot鏈接kafka異步發送消息

<dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId></dependency> spring:kafka:bootstrap-servers:- ip:端口producer:retries: 0acks: 1batch-size: 16384properties:linger:ms: 100buff…

centos 記錄用戶登陸ip和執行命令

centos 記錄用戶登陸ip和執行命令 在/etc/profile 文件末尾添加如下代碼&#xff1a; #!/bin/bash USER_IPwho -u am i 2>/dev/null | awk {print $NF} | sed -e s/[()]//g HISTDIR/usr/share/.history if [ -z "$USER_IP" ]; then USER_IPhostname fi…

VUE3學習第一篇:啟動ruoyi

1、找到ruoyi的vue3版本 然后下載代碼到本地&#xff0c; 我剛開始用的nodejs14報錯&#xff0c; 后面換成nodejs16&#xff0c;啟動前端成功了。 頁面如下圖所示

go panic

panic 能夠改變程序的控制流&#xff0c;調用 panic 后會立刻停止執行當前函數的剩余代碼&#xff0c;并在當前 goroutine 中遞歸執行調用方的 defer。 // A _panic holds information about an active panic. // // A _panic value must only ever live on the stack. // // …

【JPCS出版,EI穩定檢索會議推薦】第四屆計算機、遙感與航空航天國際學術會議(CRSA 2024)已成功申請JPCS出版,火熱征稿中!

【EI核心、Scopus】第四屆計算機、遙感與航空航天國際學術會議&#xff08;CRSA 2024&#xff09;將于2024年7月5-7日在日本大阪舉行。計算機、遙感與航空航天國際學術會議為來自世界各地的研究學者、工程師、學會會員以及相關領域的專家們提供一個關于“計算機科學”、“遙感技…

體驗SmartEDA的高效與便捷,電子設計從未如此簡單

SmartEDA&#xff1a;革新電子設計&#xff0c;讓高效與便捷觸手可及 在快節奏的現代生活中&#xff0c;科技日新月異&#xff0c;各行各業都在尋求更高效、更便捷的解決方案。對于電子設計行業而言&#xff0c;SmartEDA的出現&#xff0c;無疑是一場革命性的變革。它以其高效…

【PG16】后 EL 7 時代,PG 16 如何在 CentOS 7 上運行

↑ 關注“少安事務所”公眾號&#xff0c;歡迎?收藏&#xff0c;不錯過精彩內容~ ★ 本文寫于 2023-09-29 PostgreSQL 16 Released 9/14, PostgreSQL 16 正式發布。從發布公告^1 和 Release Notes^2 可以看到 PG16 包含了諸多新特性和增強改進。 性能提升&#xff0c;查詢計劃…

快速核對兩個表格數據

快速核對兩個表格數據的方法取決于數據的規模、復雜性以及你使用的工具。以下是一些常見的方法&#xff1a; 使用Excel或其他電子表格軟件: VLOOKUP 或 HLOOKUP 函數&#xff1a;這些函數可以在一個表格中查找與另一個表格匹配的值&#xff0c;并返回對應的結果。條件格式&…

Genzai:一款針對物聯網安全的多功能實用性工具套件

關于Genzai Genzai是一款針對物聯網安全的多功能實用性工具套件&#xff0c;該工具旨在識別與物聯網相關的儀表盤&#xff0c;并掃描它們以查找默認密碼和安全問題&#xff0c;廣大研究人員可以使用該工具來檢測和提升物聯網設備的安全性。 Genzai支持用戶以輸入的形式提供一個…

npm install安裝時卡死時嘗試切換npm鏡像地址

當使用npm時&#xff0c;為了提高下載速度和穩定性&#xff0c;特別是針對國內的開發者&#xff0c;經常需要配置國內的鏡像源&#xff0c;如淘寶npm鏡像。以下是如何添加淘寶源等鏡像內容的詳細步驟和說明&#xff1a; 1. 淘寶npm鏡像地址 淘寶npm鏡像的地址在2022年6月30日…

簡愛的思維導圖怎么做?從這三個角度

簡愛的思維導圖怎么做&#xff1f;《簡愛》作為夏洛蒂勃朗特的代表作&#xff0c;不僅是一部經典的愛情小說&#xff0c;也是探索女性獨立與自我成長的文學巨著。為了深入理解這部作品&#xff0c;制作思維導圖是一種高效的學習和分析工具。以下是三種不同的角度來創建《簡愛》…

探討開源與閉源大模型在AI領域的發展前景與挑戰

一、引言 隨著人工智能&#xff08;AI&#xff09;技術的飛速發展&#xff0c;大模型已成為推動AI技術進步的核心動力。在AI大模型的發展過程中&#xff0c;開源與閉源兩種不同的發展路徑各自展現出了獨特的發展前景與挑戰。本文將深入探討這兩種路徑在AI領域的發展前景&#…