背景
這個項目是用來生成結構化的電子病歷的。數據的來源是醫生的錄音。中間有一大堆的處理,語音識別,關鍵字匹配,結構化處理,病歷編輯......。最多的時候給上百家醫院服務。
語音識別質量的跟蹤
一、0225醫院的訓練后的情況分析:
通過0225醫院的20278、46248、47146、47160、27823、47830、47879、48824、48837、48848醫生的統計,發現這批醫生在訓練之后識別的質量有提升。具體如下:
通過曲線可以看出,在人工訓練之后(圖中的豎線右邊的部分),Score有所提高,平均提高50分左右。
通過曲線可以看出,在訓練之后(圖中的豎線右邊的部分),識別引擎在識別過程中耗費的時間大大降低了。識別時間的降低,可以減少報告的識別超時從而降低BlankCDA的報告數,同時也能減輕識別服務器的壓力。所以,識別時間的降低對整個系統有著積極的意義。
二、其他醫院的訓練分析:
其他醫院訓練的時間比較早,當時的日志記錄中還沒有SR_Score的記錄。需要等下次訓練后,才可以進行識別質量分析。
三、當前識別質量統計:
?????? 就目前的統計數據來看,在800分(滿分為1000分)以下或識別時長超過4倍的醫生還有一些,但是比例不是很大。具體如下:
??????
??????
?????? 就統計結果來看,Score低于800的大約占1.27%
??????
就統計結果來看,識別時間大于4的大約占5.07%
四、識別分數低于800或識別時長超過4的醫生的列表:
????共計46人,詳見下表。
HOSP_CODE | DOCTOR | AVG_SR_SCORE | PROCESSTIME/DICTLEN |
0011 | 561 | 813 | 5.13 |
0013 | 0402 | 828 | 4.80 |
0013 | 2213 | 819 | 4.04 |
0013 | 3032 | 861 | 4.05 |
0013 | 3170 | 805 | 5.66 |
0013 | 3268 | 795 | 4.37 |
0014 | 0004 | 742 | 6.41 |
0014 | 0824 | 751 | 5.56 |
0014 | 4401 | 816 | 4.85 |
0014 | 77807 | 831 | 4.30 |
0014 | 9596 | 860 | 4.64 |
0015 | 80000 | 835 | 4.33 |
0015 | 98400 | 821 | 5.14 |
0016 | 1512 | 784 | 5.56 |
0016 | 1710 | 805 | 4.91 |
0016 | 2087 | 831 | 4.68 |
0016 | 2156 | 855 | 4.18 |
0016 | 2176 | 697 | 3.17 |
0016 | 2462 | 860 | 4.03 |
0016 | 3274 | 787 | 4.27 |
0016 | 3323 | 852 | 4.14 |
0016 | 4367 | 860 | 4.02 |
0016 | 559 | 857 | 4.02 |
0066 | 0430 | 813 | 4.96 |
0066 | 2259 | 828 | 4.21 |
0066 | 2485 | 771 | 5.46 |
0066 | 2742 | 807 | 4.91 |
0066 | 2832 | 807 | 5.50 |
0066 | 3031 | 820 | 4.37 |
0066 | 3131 | 832 | 4.54 |
0066 | 4196 | 571 | 5.35 |
0066 | 5222 | 849 | 4.45 |
0066 | 5853 | 782 | 4.74 |
0066 | 6910 | 875 | 4.54 |
0088 | 366 | 827 | 4.23 |
0223 | 17355 | 858 | 4.09 |
0223 | 42648 | 807 | 4.86 |
0223 | 7790 | 815 | 5.16 |
0225 | 14383 | 809 | 4.17 |
0225 | 40922 | 836 | 4.44 |
0225 | 42145 | 812 | 4.46 |
0225 | 43724 | 621 | 3.37 |
0225 | 45217 | 816 | 4.32 |
0225 | 46268 | 793 | 4.74 |
0225 | 47823 | 827 | 4.29 |
0225 | 48848 | 865 | 4.22 |
對于特定醫生的語音識別質量跟蹤
5853醫生的識別質量變化曲線:
6910醫生的識別質量變化曲線:
5018醫生的識別質量變化曲線:
1375醫生的識別質量變化曲線:
?