分類算法應用場景實例二十則

1 O2O優惠券使用預測

? ? ? ?以優惠券盤活老用戶或吸引新客戶進店消費是O2O的一種重要營銷方式。然而隨機投放的優惠券對多數用戶造成無意義的干擾。對商家而言,濫發的優惠券可能降低品牌聲譽,同時難以估算營銷成本。個性化投放是提高優惠券核銷率的重要技術,它可以讓具有一定偏好的消費者得到真正的實惠,同時賦予商家更強的營銷能力。

現有O2O場景相關的豐富數據,希望通過分析建模,精準預測用戶是否會在規定時間內使用相應優惠券。

2 市民出行選乘公交預測

? ? ? ?基于海量公交數據記錄,希望挖掘市民在公共交通中的行為模式。以市民出行公交線路選乘預測為方向,期望通過分析廣東省部分公交線路的歷史公交卡交易數據,挖掘固定人群在公共交通中的行為模式,分析推測乘客的出行習慣和偏好,從而建立模型預測人們在未來一周內將會搭乘哪些公交線路,為廣大乘客提供信息對稱、安全舒適的出行環境,用數據引領未來城市智慧出行。

3待測微生物種類判別

? ? ? ?DNA是多數生物的遺傳物質,DNA上的堿基(A,T,C和G)就儲藏了遺傳信息,不同物種的DNA序列在序列長度和堿基組成上差異顯著。所以我們能夠通過DNA序列的比較分析,來判斷DNA序列是來自哪些物種。由于測序技術限制,我們只能得到一定長度的DNA序列片段。通過DNA序列片段與已知的微生物DNA序列進行比較,可以確定DNA片段的來源微生物,進而確定待測微生物種類。

? ? ? ?期望在相關數據基礎上,建立分析方法,在計算資源消耗盡量小的情況下,盡可能快地給出準確的結果,以滿足臨床診斷需求。

4 基于運營商數據的個人征信評估

? ? ? ?運營商作為網絡服務供應商,積累了大量的用戶基本信息及行為特征數據,如終端數據、套餐消費數據、通信數據等等。實名制政策保證了運營商用戶數據能與用戶真實身份匹配,并真實客觀的反映用戶行為。廣泛覆蓋的網絡基礎設施提供了積累大量實時數據的條件,這些用戶數據實時反饋著用戶的各個維度的信息及特征。

? ? ? ?在我國,個人征信評估主要通過引用央行個人征信報告,但對于很多用戶沒有建立個人信用記錄的用戶,金融機構想要了解他們的信用記錄成本又較高,傳統征信評估手段難以滿足目前多種多樣的新興需求。金融業務不同于其他大數據業務,對數據的真實性、可信度和時效性要求較高,而這正是運營商數據的價值所在。

? ? ? ?期望利用運營商用戶數據,提供完善的個人征信評估。

5 商品圖片分類

? ? ? ?京東含有數以百萬計的商品圖片,“拍照購”“找同款”等應用必須對用戶提供的商品圖片進行分類。同時,提取商品圖像特征,可以提供給推薦、廣告等系統,提高推薦/廣告的效果。

? ? ? ?希望通過對圖像數據進行學習,以達到對圖像進行分類劃分的目的。

6 廣告點擊行為預測

? ? ? ?用戶在上網瀏覽過程中,可能產生廣告曝光或點擊行為。對廣告點擊進行預測,可以指導廣告主進行定向廣告投放和優化,使廣告投入產生最大回報。

? ? ? ?希望基于100萬名隨機用戶在六個月的時間范圍內廣告曝光和點擊日志,包括廣告監測點數據,預測每個用戶在8天內是否會在各監測點上發生點擊行為。

7 基于文本內容的垃圾短信識別

? ? ? ?垃圾短信已日益成為困擾運營商和手機用戶的難題,嚴重影響到人們正常生活、侵害到運營商的社會形象以及危害著社會穩定。而不法分子運用科技手段不斷更新垃圾短信形式且傳播途徑非常廣泛,傳統的基于策略、關鍵詞等過濾的效果有限,很多垃圾短信“逃脫”過濾,繼續到達手機終端。

? ? ? ?希望基于短信文本內容,結合機器學習算法、大數據分析挖掘來智能地識別垃圾短信及其變種。

8 中文句子類別精準分析

? ? ? ?精確的語義分析是大數據必備技術,在分析句子時,不同句子類別即使用類似的關鍵詞,表達的含義仍有很大差別,特別是在情感判斷中。

? ? ? ?希望通過新聞以及微博等文本數據,對其句子類別進行判斷。

9 P2P網絡借貸平臺的經營風險量化分析

? ? ? ?P2P網絡借貸即點對點信貸,其風險情況始終觸碰著投資人的神經。據網貸之家統計,截止今年9月份,出現問題的網貸平臺一共有1008家,而僅僅今年就有641家平臺出現問題,這說明了隨著我國p2p行業的迅猛發展,P2P平臺的風險預測已經成為一個至關重要的問題。P2P平臺的風險主要是在運營過程中產生的,與運營數據有著密不可分的關系。P2P平臺的風險預測并非無線索可尋,像借款期限和年化收益率等指標,就對P2P平臺的風險預測有很重要的參考意義。

? ? ? ?希望通過互聯網數據,構建出P2P網貸平臺的經營風險模型,從而能夠比較準確的預測P2P網貸平臺的經營風險,促進我國P2P行業向正規化方向發展。

10 國家電網客戶用電異常行為分析

? ? ? ?社會經濟的發展使得社會用電量逐年增加,受利益驅使,竊電現象也日益嚴重。竊電行為不僅給供電企業造成了重大經濟損失,也嚴重影響了正常的供用電秩序。根據國家電網公司統計,近年因竊電導致的損失達上千萬元。近年來,竊電方式也由野蠻竊電發展到設備智能化、手段專業化、行為隱蔽化、實施規模化的高科技竊電,給反竊電工作進一步增加了很大的難度。隨著電力系統升級,智能電力設備的普及,國家電網公司可以實時收集海量的用戶用電行為數據、電力設備監測數據,因此,國家電網公司希望通過大數據分析技術,科學的開展防竊電監測分析,以提高反竊電工作效率,降低竊電行為分析的時間及成本。

? ? ? ?希望基于國家電網公司提供的關于用戶用電量、電能表停走、電流失流、計量們打開燈計量異常情況、竊電行為等相關數據,以及經過現場電工人員現場確認的竊電用戶清單,希望參賽者利用大數據分析算法與技術,發現竊電用戶的行為特征,形成竊電用戶行為畫像,準確識別竊電用戶,以幫助系統更快速、準確地識別竊電用戶,提高竊電監測效率,降低竊電損失。

11 自動駕駛場景中的交通標志檢測

? ? ? ?在自動駕駛場景中,交通標志的檢測和識別對行車周圍環境的理解起著至關重要的作用。例如通過檢測識別限速標志來控制當前車輛的速度等;另一方面,將交通標志嵌入到高精度地圖中,對定位導航也起到關鍵的輔助作用。交通標志的檢測是一項非常有挑戰的任務,精確的檢測對后續識別,輔助定位導航起著決定性的作用。交通標志的種類眾多,大小、角度不依,本身就很難做到精確檢測,并且在真實的行車環境中,受到天氣、光照等因素的影響,使得交通標志的檢測更加困難。

? ? ? ?希望機遇完全真實場景下的圖片數據用于訓練和測試,訓練能夠實際應用在自動駕駛中的識別模型。

12 大數據精準營銷中搜狗用戶畫像挖掘

? ? ? ?“物以類聚,人以群分”這句古語不僅揭示了物與人的自組織趨向,更隱含了“聚類”和“人群”之間的內在聯系。在現代數字廣告投放系統中,以物擬人,以物窺人,才是比任何大數據都要更大的前提。在現代廣告投放系統中,多層級成體系的用戶畫像構建算法是實現精準廣告投放的基礎技術之一。其中,基于人口屬性的廣告定向技術是普遍適用于品牌展示廣告和精準競價廣告的關鍵性技術。在搜索競價廣告系統中,用戶通過在搜索引擎輸入具體的查詢詞來獲取相關信息。因此,用戶的歷史查詢詞與用戶的基本屬性及潛在需求有密切的關系。

? ? ? ?希望基于用戶歷史一個月的查詢詞與用戶的人口屬性標簽(包括性別、年齡、學歷)做為訓練數據,通過機器學習、數據挖掘技術構建分類算法來對新增用戶的人口屬性進行判定。

13 基于視角的領域情感分析

? ? ? ?情感分析是網絡輿情分析中必不可少的技術,基于視角的領域情感分析更是情感分析應用于特定領域的關鍵技術。在對句子進行情感分析時,站在不同的視角,同一個句子的情感傾向判斷結果將有所差別。

? ? ? ?給定一個句子,如果該句子中包含“視角”詞語,則應針對這一視角進行情感分析;如果句子中包含多個“視角”詞語,則應對不同的視角進行單獨的情感分析;如果句子中不包含視角,則不做情感判別處理。

14 監控場景下的行人精細化識別

? ? ? ?隨著平安中國、平安城市的提出,視頻監控被廣泛應用于各種領域,這給維護社會治安帶來了便捷;但同時也帶來了一個問題,即海量的視頻監控流使得發生突發事故后,需要耗費大量的人力物力去搜索有效信息。行人作為視頻監控中的重要目標之一,若能對其進行有效的外觀識別,不僅能提高視頻監控工作人員的工作效率,對視頻的檢索、行人行為解析也具有重要意義。

? ? ? ?希望基于監控場景下多張帶有標注信息的行人圖像,在定位(頭部、上身、下身、腳、帽子、包)的基礎上研究行人精細化識別算法,自動識別出行人圖像中行人的屬性特征。標注的行人屬性包括性別、頭發長度和上下身衣著、鞋子及包的種類和顏色,并提供圖像中行人頭部、上身、下身、腳、帽子、包位置的標注。

15 用戶評分預測

? ? ? ?個性化推薦已經成為各大電子商務網站的必備服務。準確的推薦不僅可以提高商家的產品銷量,更能為顧客提供優質快速的購物體驗。推薦系統發展至今,已經有許多非常優秀的推薦算法,從各種不同的角度來為電子商務大廈添磚加瓦。迄今為止,已經有不少研究表明,用戶在短期時間內會瀏覽相似的商品,但其興趣可能會隨時間發生些許變化。

? ? ? ?希望通過訓練帶有時間標記的用戶打分行為,準確地預測這些用戶對其他商品的打分。

16 貓狗識別大戰

? ? ? ?有人說,貓與狗上千年歷史的敵對狀態,主要是由于在長期進化過程中迫于對生存資源進行爭奪而造成的殘酷競爭導致的;也有人說,是他們天生的交流方式不同導致的;今天貓狗大戰開始了,為了避免被這些家伙拆房的危險,各位智慧的人類,請速來隔離高冷貓和憨厚狗。

? ? ? ?希望從訓練集里建立一個模型去識別測試集里的小狗來。

17 微額借款用戶人品預測

? ? ? ?互聯網金融近年來異常火熱,大量的資本和人才涌入這個領域發掘富藏價值。金融領域無論是投資理財還是借貸放款,風險控制永遠是業務的核心基礎。而在所有的互聯網金融產品中,微額借款(借款金額500元~1000元)因其主要服務對象的特殊性,被公認為是風險最高的細分領域。

? ? ? ?希望通過數據挖掘來分析”小額微貸“申請借款用戶的信用狀況,以分析其是否逾期。

18 驗證碼識別

? ? ? ?使用各類驗證碼的訓練集進行學習、編碼與測試,形成驗證碼算法模型。

19 客戶流失率預測

? ? ? ?我國的移動通信行業經過了前幾年的高速發展,近一段時間的發展速度逐漸緩慢下來。注冊用戶常常處于一種動態變化的狀態,即不斷有老客戶離網,又不斷有新客戶入網。大量的低消費客戶和大量老客戶的離網使得移動通信公司無法快速向前發展。

? ? ? ?希望建立客戶流失模型,對新老客戶進行分類。

20 汽車4S店郵件營銷方案

? ? ? ?直郵營銷是直效行銷的一種,是把傳統郵件直接發送給消費者的營銷方式涉及的行業主要是大型商場、大賣場、商業連鎖店鋪、專賣店等。一家汽車4S店,公司擁有完備的客戶歷史消費數據庫,現公司準備舉辦一次高端品牌汽車的促銷活動,為配合這次促銷活動,公司計劃為潛在客戶寄去一份精美的汽車銷售材料并附帶一份小禮品。由于資源有限,公司僅有1000份材料和禮品的預算額度。

? ? ? ?希望根據與這次促銷活動類似的已經舉辦過的促銷活動的歷史消費數據,用過機器學習算法得到一個分類器,對新客戶進行分類,生成正類客戶的客戶列表,向他們寄出材料和禮品。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/387340.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/387340.shtml
英文地址,請注明出處:http://en.pswp.cn/news/387340.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Shell03

查看字符數的方法: seq -s " " 100 #以空格為分隔符,輸出從1到100 seq 100 #以換行為分隔符 charsseq -s " " 100 echo $chars echo ${#chars} #統計字符數 echo $(expr length "$chars") #統計字符數 echo $cha…

luogu P3244 [HNOI2015]落憶楓音

傳送門 md這題和矩陣樹定理沒半毛錢關系qwq 首先先不考慮有環,一個\(DAG\)個外向樹個數為\(\prod_{i2}^{n}idg_i(\)就是\(indegree_i)\),因為外向樹每個點入度為一,對于一個點有入度個父親可選,然后乘法原理起來就是答案 現在可能加一條邊會有環,那么答案可以考慮總方案減不合法…

EM算法 案例量則

例子一:理論: 簡版:猜(E-step),反思(M-step),重復; 啰嗦版: 你知道一些東西(觀察的到的數據), 你不知道一些東西(觀察不到…

遠程拷貝代碼 指定端口

將本地testdir拷貝到遠程服務器tmp目錄下 scp -r -p 9022 testdir xiaoming192.168.0.2:/tmp/ 轉載于:https://www.cnblogs.com/sea-stream/p/10436199.html

C#編寫TensorFlow人工智能應用 TensorFlowSharp

TensorFlowSharp入門使用C#編寫TensorFlow人工智能應用學習。 TensorFlow簡單介紹 TensorFlow 是谷歌的第二代機器學習系統,按照谷歌所說,在某些基準測試中,TensorFlow的表現比第一代的DistBelief快了2倍。 TensorFlow 內建深度學習的擴展支持…

簡單的MVC與SQL Server Express LocalDB

M模式: 類,表示數據的應用程序和使用驗證邏輯以強制實施針對這些數據的業務規則。V視圖: 應用程序使用動態生成 HTML 響應的模板文件。C控制器: 處理傳入的瀏覽器請求的類中檢索模型數據,然后指定將響應返回到瀏覽器的…

馬爾可夫鏈 (Markov Chain)是什么鬼

作者:紅猴子鏈接:https://www.zhihu.com/question/26665048/answer/157852228來源:知乎著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。馬爾可夫鏈 (Markov Chain)是什么鬼 它是隨機…

malloc/free 和 new/delete

(本文參考于網上) 首先兩者都可用于申請動態內存和釋放內存。 對于非內部數據類型的對象而言,只用malloc/free無法滿足動態對象的要求。對象在創建的同時要自動執行構造函數,對象在消亡之前要自動執行析構函數。由于malloc/free是庫…

主題模型-LDA淺析

個性化推薦、社交網絡、廣告預測等各個領域的workshop上都提到LDA模型,感覺這個模型的應用挺廣泛的,會后抽時間了解了一下LDA,做一下總結: (一)LDA作用 傳統判斷兩個文檔相似性的方法是通過查看兩個文檔共…

dorado-SplitSpanel控件

1.這是一個界面布局控件 2.分為SideControl邊區域和MainControl主區域 3.常用屬性 3.1 collapsed:打開頁面時,邊區域是否顯示 3.2 position:邊區域占總的大小 轉載于:https://www.cnblogs.com/ergougougou/p/10438752.html

mysql-視圖、事物等

一、視圖 視圖是一個虛擬表(非真實存在),其本質是【根據SQL語句獲取動態的數據集,并為其命名】,用戶使用時只需使用【名稱】即可獲取結果集,可以將該結果集當做表來使用。 使用視圖我們可以把查詢過程中的臨…

CAFFE怎樣跑起來

0、參考文獻 [1]caffe官網《Training LeNet on MNIST with Caffe》; [2]薛開宇《讀書筆記4學習搭建自己的網絡MNIST在caffe上進行訓練與學習》([1]的翻譯版,同時還有作者的一些注解,很贊); 1、*.sh文件如何執行? ①方…

運行caffe自帶的兩個簡單例子

為了程序的簡潔,在caffe中是不帶練習數據的,因此需要自己去下載。但在caffe根目錄下的data文件夾里,作者已經為我們編寫好了下載數據的腳本文件,我們只需要聯網,運行這些腳本文件就行了。 注意:在caffe中運…

quartz.net 執行后臺任務

... https://www.cnblogs.com/zhangweizhong/category/771057.html https://www.cnblogs.com/lanxiaoke/category/973331.html 宿主在控制臺程序中 using System;using System.Collections.Specialized;using System.IO;using System.Threading.Tasks;using Quartz;using Quart…

運行caffe自帶的mnist實例詳細教

為了程序的簡潔,在caffe中是不帶練習數據的,因此需要自己去下載。但在caffe根目錄下的data文件夾里,作者已經為我們編寫好了下載數據的腳本文件,我們只需要聯網,運行這些腳本文件就行了。 Mnist介紹:mnist是…

6 軟件的安裝

6 軟件包管理 6.1 簡介 軟件包分類: 源碼包 源代碼(大多數是C語言) 安裝時慢,容易報錯 >腳本安裝包 對源碼包進行改裝,使安裝更簡單,不多。 rpm包 二進制包 Ubuntu系列的二進制包不是rpm&#xf…

STD函數的內部計算公式

各股票軟件的標準差函數STD是不同的,而布林線的上下軌是以STD為基礎計算出來的,所以使用布林線應小心。以2008/3/28的上證綜指為例,利用如下代碼:"收盤價3日STD:STD(CLOSE,3);",三日收盤價分別是&#xff1a…

caffe路徑正確,卻讀不到圖片

調試caffe,用已有的網絡訓練自己的數據集的時候(我這里做的是二分類)。在生成均值文件之后,開始train,發現出現了這個問題。 1,路徑正確,卻讀不到圖片。 [db_lmdb.hpp:15] Check failed: mdb_st…

Eclipse可以執行jsp文件卻無法訪問Tomcat主頁

點擊Servers,然后雙擊本地的Tomcat服務器 出現如下界面 這里要選擇第二項 再重新啟動Tomcat就行了 轉載于:https://www.cnblogs.com/lls1350767625/p/10452565.html