詞頻統計 ccf-csp 2024-2-1

在學習了文本處理后,小?P?對英語書中的?n篇文章進行了初步整理。

具體來說,小?P將所有的英文單詞都轉化為了整數編號。

假設這 n?篇文章中共出現了?m個不同的單詞,則把它們從?1到?m進行編號。

這樣,每篇文章就簡化為了一個整數序列,其中每個數都在?1?到?m范圍內。

現給出小?P處理后的?n篇文章,對于每個單詞?ii(1≤i≤m),試統計:

  1. 單詞?i?出現在了多少篇文章中?
  2. 單詞?i在全部文章中總共出現了幾次?
輸入格式

輸入共?n+1行。

輸入的第一行包含兩個正整數?n?和?m,分別表示文章篇數和單詞編號上限。

輸入的第?i+1行包含由空格分隔的若干整數,其中第一個整數?li表示第?i篇文章的長度(單詞個數);接下來?li個整數表示對應的整數序列,序列中每個整數均在?1到?m?范圍內,各對應原文中的一個單詞。

輸出格式

輸出共?m行。

第?ii行輸出由空格分隔的兩個整數?xi和?yi,表示共有?xi篇文章包含單詞?i,總計出現次數為?yi。

數據范圍

全部的測試數據滿足?0<n,m≤100,且每篇文章至少包含一個單詞、最多不超過?100100?個單詞(1≤li≤100)。

輸入樣例:
4 3
5 1 2 3 2 1
1 1
3 2 2 2
2 3 2
輸出樣例:
2 3
3 6
2 2
樣例解釋

單詞?2?在:

  • 文章?1中出現兩次;
  • 文章?3中出現三次;
  • 文章?4?中出現一次。

因此?x2=3,y2=6.

代碼

#include<bits/stdc++.h>
using namespace std;
int main()
{// n 表示文章的篇數,m 表示單詞編號的上限int n, m;// x[i] 用于記錄單詞 i 出現在多少篇文章中int x[101];// y[i] 用于記錄單詞 i 在全部文章中總共出現的次數int y[101];// t[i] 用于記錄單詞 i 上一次出現所在文章的編號// 通過比較這個編號和當前文章編號,判斷單詞是否在新文章中出現int t[101];cin >> n >> m;// a 用于存儲當前文章的長度(單詞個數)// b 用于臨時存儲當前文章中讀取的單詞編號int a, b;// 遍歷每一篇文章,n 在這里也作為文章編號,從 n 到 0while(n --){// 讀取當前文章的長度cin >> a;// 遍歷當前文章中的每個單詞for(int i = 1; i <= a ; i ++)  {// 讀取當前文章中的一個單詞編號cin >> b;// 判斷單詞 b 是否在新的文章中出現// t[b] 記錄了單詞 b 上一次出現所在文章的編號// 如果 t[b] 不等于當前文章編號 n,說明單詞 b 在新文章中首次出現if(t[b] != n) {// 單詞 b 出現的文章篇數加 1x[b] ++;// 更新單詞 b 所在的文章編號為當前文章編號t[b] = n;}// 無論單詞 b 是否在新文章中出現,只要出現,其總出現次數就加 1y[b]++; }}// 遍歷從 1 到 m 的每個單詞編號for(int i = 1; i <= m ; i ++){// 輸出單詞 i 出現的文章篇數和在所有文章中的總出現次數cout << x[i] << " " << y[i] << endl;}return 0;
}

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/72970.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/72970.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/72970.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

用爬蟲解鎖 Shopee 店鋪商品數據,開啟電商新洞察

在電商競爭白熱化的當下&#xff0c;Shopee 作為全球知名的電商平臺&#xff0c;匯聚了海量的商品與商機。對于電商從業者、數據分析師、創業者來說&#xff0c;精準掌握 Shopee 店鋪的商品信息&#xff0c;就如同手握一把開啟財富大門的鑰匙。而爬蟲技術&#xff0c;無疑是幫助…

k8s中的service解析

k8s中的service解析 在k8s中&#xff0c;我們可以通過pod來創建服務。 然而&#xff0c;當我們創建多個 Pod 來提供同一項服務時&#xff0c;直接通過 Pod IP 進行訪問會變得復雜且不可維護。因此&#xff0c;Kubernetes 提供了 Service 這一抽象概念&#xff0c;用于對外暴露…

git 命令回退版本

1、查看提交記錄 git log --oneline # 簡化的提交歷史&#xff08;推薦&#xff09; # 或 git log # 完整提交歷史2、版本回退 git reset --hard <commit-hash>3、如果已推送過代碼到遠程倉庫&#xff0c;需強制推送更新 git push -f

深度學習與傳統算法在人臉識別領域的演進:從Eigenfaces到ArcFace

一、傳統人臉識別方法的發展與局限 1.1 Eigenfaces&#xff1a;主成分分析的經典實踐 算法原理 Eigenfaces是基于主成分分析&#xff08;PCA&#xff09;的里程碑式方法。其核心思想是將人臉圖像視為高維向量&#xff0c;通過協方差矩陣計算特征向量&#xff08;即特征臉&…

串口接收不到數據,串口RX配置(f407),f103和f407的區別

問題 芯片&#xff1a;STM32F407&#xff0c;軟件&#xff1a;標準庫 使用串口時&#xff0c;直接把之前STM32F103的串口配置移植過來&#xff0c;同樣以串口4為例&#xff0c;代碼如下&#xff1a; STM32F103 UART4&#xff1a; void UART4_Configuration(uint32_t BaudRa…

淺分析 PE3R 感知高效的三維重建

"近期&#xff0c;二維到三維感知技術的進步顯著提升了對二維圖像中三維場景的理解能力。然而&#xff0c;現有方法面臨諸多關鍵挑戰&#xff0c;包括跨場景泛化能力有限、感知精度欠佳以及重建速度緩慢。為克服這些局限&#xff0c;我們提出了感知高效三維重建框架&#…

存算一體與存算分離:架構設計的深度解析與實現方案

隨著數據量的不斷增大和對計算能力的需求日益提高&#xff0c;存算一體作為一種新型架構設計理念&#xff0c;在大數據處理、云計算和人工智能等領域正逐步引起廣泛關注。在深入探討存算一體之前&#xff0c;我們需要先了解存儲和計算的基本概念&#xff0c;以及存算分離和存算…

匯編與反匯編:DEBUG 命令使用指南

前言 匯編語言是計算機底層編程語言&#xff0c;直接與 CPU 指令集對應。掌握匯編語言和調試工具&#xff08;如DEBUG&#xff09;是深入理解計算機工作原理的關鍵。本文將介紹匯編與反匯編的基本概念&#xff0c;并詳細講解如何使用 DEBUG 命令進行調試和內存操作。 目錄 一、…

數據分析的12個挑戰及其解決方法

俗話說得好“說起來容易做起來難。”數據分析對于風險管理者是極為重要的。我們可以利用數據分析結論&#xff0c;來為企業決策做有效協助&#xff0c;幫助企業改善財務狀況&#xff0c;提升企業業務銷售水平&#xff0c;幫助員工預測可能發生的問題&#xff0c;并協助監控企業…

棧/堆/static/虛表

在 C 里&#xff0c;棧空間主要用來存放局部變量、函數調用信息等。下面為你介紹棧空間在 C 里的運用方式。 1. 局部變量的使用 在函數內部定義的變量會被存于棧空間&#xff0c;當函數執行結束&#xff0c;這些變量會自動被銷毀。 #include <iostream>void exampleFu…

Vue keepalive學習用法

在Vue中&#xff0c;<keep-alive>的include屬性用于指定需要緩存的組件&#xff0c;其實現方式如下&#xff1a; 1. 基本用法 ? 字符串形式&#xff1a;通過逗號分隔組件名稱&#xff0c;匹配到的組件會被緩存。 <keep-alive include"ComponentA,ComponentB&…

搭建個人博客教程(Hexo)

如何快速搭建一套本地的博客系統呢&#xff1f;這里有一套gitNode.jsHexo的部署方案來進行解決。 安裝git Git 是一款免費開源的分布式版本控制系統&#xff0c;由 Linus Torvalds 于 2005 年為 Linux 內核開發設計。它通過本地倉庫和遠程倉庫實現代碼管理&#xff0c;支持分支…

手撕算法之`vector` 擴容、`string` 分割、鏈表翻轉

手寫常見操作:vector 擴容、string 分割、鏈表翻轉 (一)vector擴容 在 C++ 中,vector 的擴容機制是動態數組實現的核心特性,直接關系到性能和內存使用效率。以下是深入剖析: 1. 擴容觸發條件 vector<int> v; v.push_back(1); // 當 size() == capacity() 時觸發…

鴻蒙NEXT開發問題大全(不斷更新中.....)

目錄 問題1&#xff1a;鴻蒙NEXT獲取華為手機的udid ?問題2&#xff1a;[Fail]ExecuteCommand need connect-key? 問題3&#xff1a;測試時如何安裝app包 問題1&#xff1a;鴻蒙NEXT開發獲取華為手機的udid hdc -t "設備的序列號" shell bm get --udid 問題2&…

LiteratureReading:[2016] Enriching Word Vectors with Subword Information

文章目錄 一、文獻簡明&#xff08;zero&#xff09;二、快速預覽&#xff08;first&#xff09;1、標題分析2、作者介紹3、引用數4、摘要分析&#xff08;1&#xff09;翻譯&#xff08;2&#xff09;分析 5、總結分析&#xff08;1&#xff09;翻譯&#xff08;2&#xff09;…

ZMC600E,多核異構如何成就機器人精準控制?

ZMC600E主站控制器憑借其多核異構處理器的強大性能&#xff0c;實現了高算力與高實時性的完美平衡&#xff0c;讓機器人動作流暢、精準無誤。接下來&#xff0c;讓我們深入了解其內核結構的奧秘。 在ZMC600E主站控制器控制機器人的時候&#xff0c;可以精準的控制機器人執行各種…

一文掌握 PostgreSQL 的各種指令(PostgreSQL指令備忘)

引言 PostgreSQL 作為一款功能強大、開源的關系型數據庫管理系統&#xff08;RDBMS&#xff09;&#xff0c;以其高擴展性、SQL 標準兼容性以及豐富的功能特性&#xff0c;成為企業級應用的首選數據庫之一。無論是開發、運維還是數據分析&#xff0c;掌握 PostgreSQL 的核心指…

fastadmin后臺管理員日志指定方法不記錄

做的訂單提醒,只要在線會把日志自動存儲進去,這個又是每30s執行一次,數據庫沒多久就爆掉了,最終找到一個處理方法,可能不是最好的,僅供大家參考 具體位置: application/admin/model/AdminLog.php里面的$ignoreRegex方法 protected static $ignoreRegex [/^(.*)\/(selectpage…

Redis Sentinel(哨兵模式)高可用性解決方案

一、概述 Redis Sentinel&#xff08;哨兵模式&#xff09;是Redis的高可用性&#xff08;High Availability, HA&#xff09;解決方案&#xff0c;它通過哨兵系統和Redis實例的協同工作&#xff0c;確保了Redis服務的高可用性和數據的持久性。哨兵系統由一個或多個哨兵進程組…

密碼學(Public-Key Cryptography and Discrete Logarithms)

Public-Key Cryptography and Discrete Logarithms Discrete Logarithm 核心概念&#xff1a;離散對數是密碼學中一個重要的數學問題&#xff0c;特別是在有限域和循環群中。它基于指數運算在某些群中是單向函數這一特性。也就是說&#xff0c;給定一個群 G G G和一個生成元 …