支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo
import json
import openai
from pathlib import Path
import os
client = openai.OpenAI(base_url=base_url, api_key=api_key)
file = client.files.create(
? file=open("H3.pdf", "rb"),
? purpose='assistants'
)
assistant = client.beta.assistants.create(
? ? name="問答生成",
? ? instructions="你是一個問答生成助手,可以幫助用戶去生成問答對。",
? ? model="gpt-4-1106-preview",
? ? tools=[{"type":"retrieval"}],
? ? file_ids= [file.id]
)
print(assistant.id)
thread = client.beta.threads.create(
? messages=[
? ? {
? ? ? "role": "user",
? ? ? "content": """
? ? ? 這個文檔可以分為多個部分,分別輸出。針對每個部分生成3個問答對,合并后以中文JSON格式輸出。
? ? ? ? """
? ? }
? ]
)
print(thread.id)
run = client.beta.threads.runs.create(
? ? thread_id=thread.id,
? ? assistant_id=assistant.id
)
print(run.id)
import time
def wait_on_run(run, thread):
? ? while run.status == "queued" or run.status == "in_progress":
? ? ? ? run = client.beta.threads.runs.retrieve(
? ? ? ? ? ? thread_id=thread.id,
? ? ? ? ? ? run_id=run.id,
? ? ? ? )
? ? ? ? time.sleep(1)
? ? ? ? print("等待響應中...")
? ? return run
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
messages['data'][0]['content'][0]['text']['value']
'接下來,根據您的文檔,我將對每個部分生成問答對,并以中文JSON格式輸出。\n\n### 第一部分(發展歷程、主營業務、財務分析、公司治理)\n\n1. 福昕軟件成立于哪一年?\n A: 福昕軟件成立于2001年。\n\n2. 福昕軟件的主營業務是什么?\n A: 福昕軟件的主營業務是聚焦PDF相關解決方案。\n\n3. 福昕軟件在員工利益方面采取了哪些措施?\n A: 福昕軟件制定了長期持股計劃以綁定員工利益。【13?source】\n\n### 第二部分(所處行業分析)\n\n1. 福昕軟件公司的產品在哪些方面具有競爭力?\n A: 福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。\n\n2. 福昕軟件未來的市場發展潛力如何?\n A: 福昕軟件公司后續有望搶占更多市場份額。【14?source】\n\n### 第三部分(訂閱+渠道雙轉型)\n\n1. “訂閱+渠道”雙轉型的核心策略是什么?\n A: 福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。\n\n2. 福昕軟件訂閱模式為客戶提供了哪些增值服務?\n A: 福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。【15?source】\n\n### 第四部分(境外收入占比、境內市場拓展)\n\n1. 福昕軟件在境內市場拓展方面的策略是什么?\n A: 福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。【16?source】\n\n### 第五部分(AIGC賦能、產品競爭力)\n\n1. 福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?\n A: 福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。【17?source】\n\n2. 接入ChatGPT后的產品變化有哪些?\n A: 接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。\n\n### 第六部分(盈利預測、估值與投資評級)\n\n1. 福昕軟件的投資評級如何?\n A: 福昕軟件的投資評級為“買入”。【18?source】\n\n2. 根據估值模型,福昕軟件的目標市值是多少?\n A: 根據估值模型,福昕軟件的目標市值為117.0億元。\n\n將以上問答對合并并轉換為JSON格式如下:\n```json\n[\n {\n "part": "第一部分",\n "qa_pairs": [\n {\n "question": "福昕軟件成立于哪一年?",\n "answer": "福昕軟件成立于2001年。"\n },\n {\n "question": "福昕軟件的主營業務是什么?",\n "answer": "福昕軟件的主營業務是聚焦PDF相關解決方案。"\n },\n {\n "question": "福昕軟件在員工利益方面采取了哪些措施?",\n "answer": "福昕軟件制定了長期持股計劃以綁定員工利益。"\n }\n ]\n },\n {\n "part": "第二部分",\n "qa_pairs": [\n {\n "question": "福昕軟件公司的產品在哪些方面具有競爭力?",\n "answer": "福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。"\n },\n {\n "question": "福昕軟件未來的市場發展潛力如何?",\n "answer": "福昕軟件公司后續有望搶占更多市場份額。"\n }\n ]\n },\n {\n "part": "第三部分",\n "qa_pairs": [\n {\n "question": "“訂閱+渠道”雙轉型的核心策略是什么?",\n "answer": "福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。"\n },\n {\n "question": "福昕軟件訂閱模式為客戶提供了哪些增值服務?",\n "answer": "福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。"\n }\n ]\n },\n {\n "part": "第四部分",\n "qa_pairs": [\n {\n "question": "福昕軟件在境內市場拓展方面的策略是什么?",\n "answer": "福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。"\n }\n ]\n },\n {\n "part": "第五部分",\n "qa_pairs": [\n {\n "question": "福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?",\n "answer": "福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。"\n },\n {\n "question": "接入ChatGPT后的產品變化有哪些?",\n "answer": "接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。"\n }\n ]\n },\n {\n "part": "第六部分",\n "qa_pairs": [\n {\n "question": "福昕軟件的投資評級如何?",\n "answer": "福昕軟件的投資評級為“買入”。"\n },\n {\n "question": "根據估值模型,福昕軟件的目標市值是多少?",\n "answer": "根據估值模型,福昕軟件的目標市值為117.0億元。"\n }\n ]\n }\n]\n```'
print(messages['data'][0]['content'][0]['text']['value'])
接下來,根據您的文檔,我將對每個部分生成問答對,并以中文JSON格式輸出。### 第一部分(發展歷程、主營業務、財務分析、公司治理)1. 福昕軟件成立于哪一年?A: 福昕軟件成立于2001年。2. 福昕軟件的主營業務是什么?A: 福昕軟件的主營業務是聚焦PDF相關解決方案。3. 福昕軟件在員工利益方面采取了哪些措施?A: 福昕軟件制定了長期持股計劃以綁定員工利益。【13?source】### 第二部分(所處行業分析)1. 福昕軟件公司的產品在哪些方面具有競爭力?A: 福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。2. 福昕軟件未來的市場發展潛力如何?A: 福昕軟件公司后續有望搶占更多市場份額。【14?source】### 第三部分(訂閱+渠道雙轉型)
1. “訂閱+渠道”雙轉型的核心策略是什么?A: 福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。2. 福昕軟件訂閱模式為客戶提供了哪些增值服務?A: 福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。【15?source】### 第四部分(境外收入占比、境內市場拓展)1. 福昕軟件在境內市場拓展方面的策略是什么?A: 福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。【16?source】### 第五部分(AIGC賦能、產品競爭力)1. 福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?A: 福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。【17?source】2. 接入ChatGPT后的產品變化有哪些?A: 接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。### 第六部分(盈利預測、估值與投資評級)1. 福昕軟件的投資評級如何?A: 福昕軟件的投資評級為“買入”。【18?source】2. 根據估值模型,福昕軟件的目標市值是多少?A: 根據估值模型,福昕軟件的目標市值為117.0億元。
將以上問答對合并并轉換為JSON格式如下: ```json [{"part": "第一部分","qa_pairs": [{"question": "福昕軟件成立于哪一年?","answer": "福昕軟件成立于2001年。"},{"question": "福昕軟件的主營業務是什么?","answer": "福昕軟件的主營業務是聚焦PDF相關解決方案。"},{"question": "福昕軟件在員工利益方面采取了哪些措施?","answer": "福昕軟件制定了長期持股計劃以綁定員工利益。"}]},{"part": "第二部分","qa_pairs": [{"question": "福昕軟件公司的產品在哪些方面具有競爭力?","answer": "福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。"},{"question": "福昕軟件未來的市場發展潛力如何?","answer": "福昕軟件公司后續有望搶占更多市場份額。"}]}, {"part": "第三部分","qa_pairs": [{"question": "“訂閱+渠道”雙轉型的核心策略是什么?","answer": "福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。"},{"question": "福昕軟件訂閱模式為客戶提供了哪些增值服務?","answer": "福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。"}]},{"part": "第四部分","qa_pairs": [{"question": "福昕軟件在境內市場拓展方面的策略是什么?","answer": "福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。"}]},{"part": "第五部分","qa_pairs": [{"question": "福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?","answer": "福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。"},{"question": "接入ChatGPT后的產品變化有哪些?","answer": "接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。"}]}, {"part": "第六部分","qa_pairs": [{"question": "福昕軟件的投資評級如何?","answer": "福昕軟件的投資評級為“買入”。"},{"question": "根據估值模型,福昕軟件的目標市值是多少?","answer": "根據估值模型,福昕軟件的目標市值為117.0億元。"}]} ] ```
res = messages['data'][0]['content'][0]['text']['value']
json_start = res.find("```json\n")
json_end = res.find("```\n")
if json_start>=0:
? ? if json_end > json_start:
? ? ? ? res = res[json_start+8:json_end]
? ? elif json_end ==-1:
? ? ? ? res = res[json_start+8:len(res)-3]
data = json.loads(res)
data
[{'part': '第一部分','qa_pairs': [{'question': '福昕軟件成立于哪一年?', 'answer': '福昕軟件成立于2001年。'},{'question': '福昕軟件的主營業務是什么?', 'answer': '福昕軟件的主營業務是聚焦PDF相關解決方案。'},{'question': '福昕軟件在員工利益方面采取了哪些措施?', 'answer': '福昕軟件制定了長期持股計劃以綁定員工利益。'}]},{'part': '第二部分','qa_pairs': [{'question': '福昕軟件公司的產品在哪些方面具有競爭力?','answer': '福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。'},{'question': '福昕軟件未來的市場發展潛力如何?', 'answer': '福昕軟件公司后續有望搶占更多市場份額。'}]},{'part': '第三部分','qa_pairs': [{'question': '“訂閱+渠道”雙轉型的核心策略是什么?','answer': '福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。'},{'question': '福昕軟件訂閱模式為客戶提供了哪些增值服務?','answer': '福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。'}]},{'part': '第四部分','qa_pairs': [{'question': '福昕軟件在境內市場拓展方面的策略是什么?','answer': '福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。'}]},{'part': '第五部分','qa_pairs': [{'question': '福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?','answer': '福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。'},{'question': '接入ChatGPT后的產品變化有哪些?','answer': '接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。'}]},{'part': '第六部分','qa_pairs': [{'question': '福昕軟件的投資評級如何?', 'answer': '福昕軟件的投資評級為“買入”。'},{'question': '根據估值模型,福昕軟件的目標市值是多少?','answer': '根據估值模型,福昕軟件的目標市值為117.0億元。'}]}]
rows = []
for x in data:
? ? for y in x['qa_pairs']:
? ? ? ? rows.append(y)
rows
[{'question': '福昕軟件成立于哪一年?', 'answer': '福昕軟件成立于2001年。'},{'question': '福昕軟件的主營業務是什么?', 'answer': '福昕軟件的主營業務是聚焦PDF相關解決方案。'},{'question': '福昕軟件在員工利益方面采取了哪些措施?', 'answer': '福昕軟件制定了長期持股計劃以綁定員工利益。'},{'question': '福昕軟件公司的產品在哪些方面具有競爭力?','answer': '福昕軟件公司的產品在功能、價格和用戶評價上具有一定的競爭力。'},{'question': '福昕軟件未來的市場發展潛力如何?', 'answer': '福昕軟件公司后續有望搶占更多市場份額。'},{'question': '“訂閱+渠道”雙轉型的核心策略是什么?','answer': '福昕軟件的“訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。'},{'question': '福昕軟件訂閱模式為客戶提供了哪些增值服務?','answer': '福昕軟件訂閱模式為客戶提供豐富的增值服務,并提升客戶終生價值。'},{'question': '福昕軟件在境內市場拓展方面的策略是什么?','answer': '福昕軟件在境內市場拓展方面,進入行業垂直領域,依托PDF核心技術與底層代碼,結合特定行業與專業垂直領域的業務場景,拓展PDF技術的應用。'},{'question': '福昕軟件的哪一款產品接入了ChatGPT,帶來了哪些功能?','answer': '福昕軟件的Foxit PDF Editor Cloud已成功接入ChatGPT,帶來了文檔整理、文檔重寫、文檔翻譯、文檔問答、文本解析、拼寫及語法糾錯等功能。'},{'question': '接入ChatGPT后的產品變化有哪些?','answer': '接入ChatGPT后的產品具備一定提價預期,同時功能不斷完善和迭代。'},{'question': '福昕軟件的投資評級如何?', 'answer': '福昕軟件的投資評級為“買入”。'},{'question': '根據估值模型,福昕軟件的目標市值是多少?', 'answer': '根據估值模型,福昕軟件的目標市值為117.0億元。'}]
import pandas as pd
df = pd.DataFrame(rows)
df
thread_message = client.beta.threads.messages.create(
? ? thread_id=thread.id,
? ? role="user",
? ? content="每個部分可以拆分為幾個子部分,分別輸出。"
)
print(thread_message)
run = client.beta.threads.runs.create(
? ? thread_id=thread.id,
? ? assistant_id=assistant.id,
? ? model = "gpt-3.5-turbo"
)
print(run)
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
print(messages['data'][0]['content'][0]['text']['value'])
根據文檔內容,可以將文檔分為以下子部分并逐個輸出:### 第一部分(發展歷程、主營業務、財務分析、公司治理)1.1 發展歷程:公司成立時間較早,聚焦海外市場開拓 - 福昕軟件成立于2001年。1.2 主營業務:聚焦PDF相關解決方案 - 福昕軟件的主營業務是聚焦PDF相關解決方案。1.3 財務分析:依托優秀的成長性和穩固的行業地位,公司長期財務數據表現亮眼 - 公司長期財務數據表現亮眼,依托優秀的成長性和穩固的行業地位。1.4 公司治理:股權清晰且穩定,長期持股計劃綁定員工利益 - 公司股權清晰且穩定,采取長期持股計劃綁定員工利益。### 第二部分(所處行業分析)2.1 行業空間:無紙化、電子化辦公已成趨勢,PDF賽道規模劍指千億 - 行業天花板高,公司競爭力強。2.2 公司競爭力分析:公司產品在功能、價格、用戶評價三個維度均有一定競爭力,后續有望搶占更多市場份額 - 公司產品在功能、價格、用戶評價三個維度均有一定競爭力。### 第三部分(訂閱+渠道雙轉型)3.1 訂閱轉型:訂閱模式下可為客戶提供豐富的增值服務,并提升客戶終生價值 - “訂閱+渠道”雙轉型的核心策略是通過渠道轉型搶占競爭對手現有的客戶,再通過訂閱轉型獲得更多的持續性收入。3.2 渠道轉型:核心在于通過渠道觸達海量客戶資源,進而搶占更多市場份額 - 通過渠道觸達海量客戶資源,搶占更多市場份額。### 第四部分(境外收入占比、境內市場拓展)4.1 福昕家裝解決方案 - 談及福昕家裝解決方案。4.2 福昕船舶圖紙管理系統 - 談及福昕船舶圖紙管理系統。4.3 電子簽名解決方案 - 談及電子簽名解決方案。### 第五部分(AIGC賦能、產品競爭力)5.1 AIGC賦能正在進行時,產品競爭力日益凸顯 - 福昕的產品具備AIGC賦能,競爭力日益突出。### 第六部分(盈利預測、估值與投資評級)6.1 盈利預測及假設 - 公司的盈利預測及假設。6.2 估值與投資評級 - 估值模型與投資評級。這樣,每個部分都被細分并輸出了各自的子部分內容。