光學掃描式讀票機(Optical Scan)
原理:通過光學傳感器掃描選票上的標記(如鉛筆填涂、墨水筆勾選),利用圖像識別技術判斷選民選擇。
特點:
成本較低,兼容紙質選票,適合大規(guī)模選舉。
需選票格式標準化(如固定位置的填涂框)。
應用場景:美國大選、印度議會選舉等大規(guī)模紙質選票選舉。
條形碼 / 二維碼讀票機
原理:選民通過填寫或掃描條形碼 / 二維碼選票,機器讀取編碼后解析投票信息。
特點:
數據精度高,可存儲更多信息(如選區(qū)、候選人編號)。
需提前印制帶編碼的選票,適合電子化程度較高的選舉。
特征提取與判斷:識別選民的選擇意圖
根據選票標記類型(填涂、勾選、手寫符號等),算法采用不同的特征提取策略:
(1)填涂標記識別(常見場景)
面積占比法:計算填涂框內黑色像素占比,超過閾值(如 30%-50%)則判定為有效選擇。
例:選民使用 2B 鉛筆填涂候選人 A 的方框,掃描后該區(qū)域黑色像素占比達 45%,算法判定為有效投票。
邊緣檢測法:通過 Canny 或 Sobel 算子檢測填涂區(qū)域的邊緣輪廓,與標準填涂形狀(如矩形、圓形)比對,排除不規(guī)則標記(如筆尖打滑形成的短線)。
濃度梯度分析:填涂越均勻的區(qū)域,灰度值分布越集中,算法可通過統(tǒng)計像素灰度方差來區(qū)分 “認真填涂” 與 “輕微觸碰”。
(2)勾選或手寫符號識別
形態(tài)學分析:通過膨脹、腐蝕等形態(tài)學運算,將勾選符號(√)或手寫標記(如 “○”)轉換為標準形狀,再與預設模板匹配。
方向特征提?。簩τ谛本€標記(如 “/”),計算像素分布的梯度方向,判斷是否符合 “勾選” 的典型角度(如 45° 或 135°)。
(3)異常標記檢測
多選判定:同一候選區(qū)域內檢測到多個標記(如同時填涂兩個候選人框),或單票標記數超過規(guī)定(如總統(tǒng)選舉多選 1 人),則判定為無效票。
空白票識別:所有候選區(qū)域標記面積均低于閾值,判定為未投票。
4. 結果驗證與輸出:確保計數準確性
重復校驗:對關鍵標記區(qū)域進行多次掃描(如兩次獨立圖像采集),結果一致才確認有效。
人工復核接口:對算法判定存疑的選票(如填涂面積接近閾值、標記形狀模糊),生成圖像供選舉工作人員人工審核(如美國部分州要求對 “爭議票” 進行人工查驗)。
數據輸出:將識別結果轉換為結構化數據(如候選人 ID、得票數),同步至中央數據庫或打印紙質統(tǒng)計表。
典型技術挑戰(zhàn)與解決方案
挑戰(zhàn)場景 技術應對措施
不同墨水的反光差異 - 采用多光譜光源(如紅光 + 紅外光),針對不同墨水(鉛筆、藍黑墨水、熒光筆)調整檢測波長。
- 機器學習模型訓練:用歷史數據訓練分類器,區(qū)分不同墨水材質的標記。
選票折疊或污漬干擾 - 圖像修復算法:通過插值法填充折疊造成的圖像缺失區(qū)域。
- 污漬識別模型:用深度學習區(qū)分 “人為標記” 與 “自然污漬”(如咖啡漬形狀通常更不規(guī)則)。
非標準填涂(如超框、輕描) - 彈性閾值設定:根據填涂中心位置,允許標記超出框線一定范圍(如框線外 5 像素內仍算有效)。
- 概率化判定:結合填涂位置、面積、濃度等多維度特征,給出 “有效概率”(如 80% 概率為有效標記),而非非黑即白的判斷。
選票格式變更(如新版選票) - 動態(tài)模板配置:允許管理員導入新選票模板,自動更新 ROI 區(qū)域坐標與標記規(guī)則,無需修改底層算法。