jquery數據折疊_通過位折疊縮小大數據

jquery數據折疊

Sometimes your dataset is just too large, and you need a way to shrink it down to a reasonable size. I am suffering through this right now as I work on different machine learning techniques for checkers. I could work for over 18 years and buy over 10 petabytes of data to solve it, but I would rather just give up on some of the quality of the solution, get a program that can play checkers well, and use fewer resources in the process.

有時您的數據集過大,您需要一種將其縮小到合理大小的方法。 當我為跳棋員開發不同的機器學習技術時,我現在正遭受這種痛苦。 我可以工作18年以上,并購買超過10 PB的數據來解決它 ,但是我寧愿放棄一些解決方案的質量,獲得一個可以很好地運行檢查程序并在此過程中使用更少資源的程序。

One technique you can use is called bit folding. This technique is similar to hashing in that the function is one way and it can produce the same result for multiple inputs. This latter phenomenon is known as collision. While collision has a bad connotation when hashing, we need collision in order for this to work for data shrinking.

您可以使用的一種技術稱為位折疊。 該技術類似于哈希,因為函數是一種方式,并且可以為多個輸入產生相同的結果。 后一種現象稱為碰撞。 盡管在散列時沖突具有不好的含義,但我們需要沖突才能使其在數據收縮時起作用。

When folding bits, you start with your data in binary form. Then, you start folding the bits into one another, losing half of the information that you had in the two bits. How do you combine the bits? When you start with bits A and B, you may choose one of the seven operations shown in Table 1 to condense the information.

折疊位時,您將從二進制格式的數據開始。 然后,您開始將位相互折疊,從而丟失了兩位中一半的信息。 您如何組合位? 當您從位A和B開始時,可??以選擇表1所示的七個操作之一來壓縮信息。

Image for post
Table 1
表格1

Upon first observation, one may notice several combinations missing. First, outputs of all zeros and all ones are not present. This result would zeroize the information, not condense it. We do not want to remove all of the information in the input bits; we just want to shrink the information. Second, we omit all of the inverses of these outputs because inverses convey the same information as one another.

首次觀察時,可能會注意到缺少幾種組合。 首先,不存在全零和全零的輸出。 該結果將使信息歸零,而不是壓縮信息。 我們不想刪除輸入位中的所有信息。 我們只想縮小信息范圍。 其次,我們忽略了這些輸出的所有反函數,因為反函數相互傳遞相同的信息。

I wrote a short Python script that you can use to fold your bits. The first function is gen_param(size). This function generates random parameters for bit folding given the size of the input data that you want to fold. It returns two lists. The first list maps which bits to fold into which other bits, and the second gives the operations that you will use for each fold. We generate random parameters because the data is already too large, so you just need random fold parameters to help you shrink the data. Once you shrink the data and test it, you can compare randomly generated parameters to one another for improved performance. The second function, fold(value, new_size, mapping, ops), takes your parameters and returns your value folded into the size new_size.

我寫了一個簡短的Python腳本,您可以用它折疊位。 第一個函數是gen_param(size)。 給定您要折疊的輸入數據的大小,此函數將為位折疊生成隨機參數。 它返回兩個列表。 第一個列表將要折疊的位映射為其他位,第二個列表給出了每次折疊將使用的操作。 我們生成隨機參數是因為數據已經太大,因此您只需要隨機折疊參數即可幫助您縮小數據。 收縮數據并對其進行測試后,可以將隨機生成的參數相互比較以提高性能。 第二個函數fold(value,new_size,mapping,ops),獲取您的參數并返回折疊為new_size大小的值。

If your dataset is too large and you are looking for ways to shrink the data, try out my program. I use comparison testing between two sets of parameters to find the better one and improve my algorithms. With data sets that are too large, bit folding gives you speed and wieldy data sizes in exchange for precision.

如果您的數據集太大,并且您正在尋找縮小數據的方法,請嘗試我的程序。 我使用兩組參數之間的比較測試來找到更好的參數并改進算法。 對于過大的數據集,位折疊可為您提供速度快而復雜的數據大小,以換取精度。

翻譯自: https://medium.com/swlh/shrinking-big-data-with-bit-folding-4ea0aa6a055d

jquery數據折疊

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/388622.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/388622.shtml
英文地址,請注明出處:http://en.pswp.cn/news/388622.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

js基礎語法

||與&& a && b : 將a, b轉換為Boolean類型, 再執行邏輯與, true返回b, false返回aa || b : 將a, b轉換為Boolean類型, 再執行邏輯或, true返回a, false返回b轉換規則:對象為true非零數字為true非空字符串為true其他為false * 幾乎所有語言中||和&&都遵…

新鬼影病毒

今天和明天是最后兩天宿舍有空調的日子啦,暑假宿舍沒空調啊,悲催T__T 好吧,今天是最精華的部分啦對于鬼影3的分析,剩下的都是浮云啦,alg.exe不準備分析了,能用OD調試的貨.分析起來只是時間問題.但是MBR和之后的保護模式的代碼就不一樣啦同學們,純靜態分析,傷不起啊,各種硬編碼,…

php計算單雙,PHP中單雙號與變量

例子$string "beautiful";$time "winter";$str This is a $string $time morning!;echo $str. "";eval("\$str \"$str\";");echo $str;?>輸出:This is a $string $time morning!This is a beautiful win…

Silverlight:Downloader的使用(event篇)

(1)Downloader的使用首先我們看什么是Downloader,就是一個為描述Silverlight plug-in下載功能的集合.Downloader能異步的通過HTTP GET Request下載內容.他是一個能幫助Silverlight下載內容的一個對象,這些下載內容包括(XMAL content,JavaScript content,ZIP packages,Media,ima…

決策樹信息熵計算_決策樹熵|熵計算

決策樹信息熵計算A decision tree is a very important supervised learning technique. It is basically a classification problem. It is a tree-shaped diagram that is used to represent the course of action. It contains the nodes and leaf nodes. it uses these nod…

多虧了這篇文章,我的開發效率遠遠領先于我的同事

歡迎大家前往騰訊云社區,獲取更多騰訊海量技術實踐干貨哦~ 本文由獨木橋先生發表于云社區專欄 介紹 如果您有從Linux服務器上的源代碼安裝軟件的經驗,您可能會遇到make實用程序。該工具主要用于自動編譯和構建程序。它允許應用程序的作者輕松地布置構建該…

Free SQLSever 2008的書

Introducing SQL Server 2008 http://csna01.libredigital.com/?urss1q2we6這是一本提供自由使用書!我把它翻譯,或轉送有什么關系!這樣的書還是有幾本吧,Introducing Linq,Introducting Silverlight,都是啊!嘿嘿。。。…

流式數據分析_流式大數據分析

流式數據分析The recent years have seen a considerable rise in connected devices such as IoT [1] devices, and streaming sensor data. At present there are billions of IoT devices connected to the internet. While you read this article, terabytes and petabytes…

oracle failover 區別,Oracle DG failover 實戰

Oracle dataguardfailover實戰操作步驟備庫:SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH FORCE;SQL> ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;SQL> SHUTDOWN IMMEDIATE;SQL> STARTUP;添加臨時文件,刪除老的臨時文…

Jenkins自動化CI CD流水線之8--流水線自動化發布Java項目

一、前提 插件:Maven Integration plugin 環境: maven、tomcat 用的博客系統代碼: git clone https://github.com/b3log/solo.git 遠端git服務器: [gitgit repos]$ mkdir -p solo [gitgit repos]$ cd solo/ [gitgit solo]$ git --…

oracle數據泵導入很慢,impdp導入效率的問題

內網從一臺服務器A導入到另一臺服務器B,38G的數據半個多小時才導了一個表。原來B庫上是有數據的,是不是因為TABLE_EXISTS_ACTIONREPLACE 導致速度慢了?parallel8也不知道會不會設高了。SQL> show parameter cpuNAME …

BZOJ2597 WC2007剪刀石頭布(費用流)

考慮使非剪刀石頭布情況盡量少。設第i個人贏了xi場,那么以i作為贏家的非剪刀石頭布情況就為xi(xi-1)/2種。那么使Σxi(xi-1)/2盡量小即可。 考慮網絡流。將比賽建成一排點,人建成一排點,每場未確定比賽向比賽雙方連邊,確定比賽向贏…

數據科學還是計算機科學_數據科學101

數據科學還是計算機科學什么是數據科學? (What is data science?) Well, if you have just woken up from a 10-year coma and have no idea what is data science, don’t worry, there’s still time. Many years ago, statisticians had some pretty good ideas…

開機流程與主引導分區(MBR)

由于操作系統會提供所有的硬件并且提供內核功能,因此我們的計算機就能夠認識硬盤內的文件系統,并且進一步讀取硬盤內的軟件文件與執行該軟件來完成各項軟件的執行目的 問題是你有沒有發現,既然操作系統也是軟件,那么我的計算機優勢…

膚色檢測算法 - 基于二次多項式混合模型的膚色檢測。

由于CSDN博客和博客園的編輯方面有不一致的地方,導致文中部分圖片錯位,為不影響瀏覽效果,建議點擊打開鏈接。 由于能力有限,算法層面的東西自己去創新的很少,很多都是從現有的論文中學習,然后實踐的。 本文…

oracle解析儒略日,利用to_char獲取當前日期準確的周數!

總的來說周數的算法有兩種:算法一:iw算法,每周為星期一到星期日算一周,且每年的第一個星期一為第一周,就拿2014年來說,2014-01-01是星期三,但還是算為今年的第一周,可以簡單的用sql函…

密碼機

樹狀數組1 #include<bits/stdc.h>2 using namespace std;3 int x,y,c[200005];4 char str[20];5 int inline read(){6 int x0,f1;7 char chgetchar();8 while(ch<0||ch>9)9 chgetchar(); 10 while(ch>0&&ch<9){ 11 …

js有默認參數的函數加參數_函數參數:默認,關鍵字和任意

js有默認參數的函數加參數PYTHON開發人員的提示 (TIPS FOR PYTHON DEVELOPERS) Think that you are writing a function that accepts multiple parameters, and there is often a common value for some of these parameters. For instance, you would like to be able to cal…

sql management studio 附加mdf文件出錯的解決辦法

將mdf文件所在文件夾的權限改為everyone.&#xff0c;完全控制即可。

oracle raise_application_error,RAISE_ APPLICATION_ ERROR--之異常處理

平時用來測試的異常處理我們都是通過dbms_output.put_line來輸出異常信息&#xff0c;但是在實際的應用中&#xff0c;需要把異常信息返回給調用的客戶端。其實 RAISE_APPLICATION_ERROR 是將應用程序專有的錯誤從服務器端轉達到客戶端應用程序(其他機器上的SQLPLUS或者其他前臺…