光學(xué)掃描式讀票機(jī)(Optical Scan)
原理:通過(guò)光學(xué)傳感器掃描選票上的標(biāo)記(如鉛筆填涂、墨水筆勾選),利用圖像識(shí)別技術(shù)判斷選民選擇。
特點(diǎn):
成本較低,兼容紙質(zhì)選票,適合大規(guī)模選舉。
需選票格式標(biāo)準(zhǔn)化(如固定位置的填涂框)。
應(yīng)用場(chǎng)景:美國(guó)大選、印度議會(huì)選舉等大規(guī)模紙質(zhì)選票選舉。
特征提取與判斷:識(shí)別選民的選擇意圖
根據(jù)選票標(biāo)記類(lèi)型(填涂、勾選、手寫(xiě)符號(hào)等),算法采用不同的特征提取策略:
(1)填涂標(biāo)記識(shí)別(常見(jiàn)場(chǎng)景)
面積占比法:計(jì)算填涂框內(nèi)黑色像素占比,超過(guò)閾值(如 30%-50%)則判定為有效選擇。
例:選民使用 2B 鉛筆填涂候選人 A 的方框,掃描后該區(qū)域黑色像素占比達(dá) 45%,算法判定為有效投票。
邊緣檢測(cè)法:通過(guò) Canny 或 Sobel 算子檢測(cè)填涂區(qū)域的邊緣輪廓,與標(biāo)準(zhǔn)填涂形狀(如矩形、圓形)比對(duì),排除不規(guī)則標(biāo)記(如筆尖打滑形成的短線)。
濃度梯度分析:填涂越均勻的區(qū)域,灰度值分布越集中,算法可通過(guò)統(tǒng)計(jì)像素灰度方差來(lái)區(qū)分 “認(rèn)真填涂” 與 “輕微觸碰”。
(2)勾選或手寫(xiě)符號(hào)識(shí)別
形態(tài)學(xué)分析:通過(guò)膨脹、腐蝕等形態(tài)學(xué)運(yùn)算,將勾選符號(hào)(√)或手寫(xiě)標(biāo)記(如 “○”)轉(zhuǎn)換為標(biāo)準(zhǔn)形狀,再與預(yù)設(shè)模板匹配。
方向特征提取:對(duì)于斜線標(biāo)記(如 “/”),計(jì)算像素分布的梯度方向,判斷是否符合 “勾選” 的典型角度(如 45° 或 135°)。
(3)異常標(biāo)記檢測(cè)
多選判定:同一候選區(qū)域內(nèi)檢測(cè)到多個(gè)標(biāo)記(如同時(shí)填涂?jī)蓚€(gè)候選人框),或單票標(biāo)記數(shù)超過(guò)規(guī)定(如總統(tǒng)選舉多選 1 人),則判定為無(wú)效票。
空白票識(shí)別:所有候選區(qū)域標(biāo)記面積均低于閾值,判定為未投票。
4. 結(jié)果驗(yàn)證與輸出:確保計(jì)數(shù)準(zhǔn)確性
重復(fù)校驗(yàn):對(duì)關(guān)鍵標(biāo)記區(qū)域進(jìn)行多次掃描(如兩次獨(dú)立圖像采集),結(jié)果一致才確認(rèn)有效。
人工復(fù)核接口:對(duì)算法判定存疑的選票(如填涂面積接近閾值、標(biāo)記形狀模糊),生成圖像供選舉工作人員人工審核(如美國(guó)部分州要求對(duì) “爭(zhēng)議票” 進(jìn)行人工查驗(yàn))。
數(shù)據(jù)輸出:將識(shí)別結(jié)果轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)(如候選人 ID、得票數(shù)),同步至中央數(shù)據(jù)庫(kù)或打印紙質(zhì)統(tǒng)計(jì)表。
選票預(yù)處理:通過(guò)紅外光源掃描選票,生成灰度圖像,同時(shí)檢測(cè)選票邊緣的定位孔(registration holes)以校準(zhǔn)位置。
區(qū)域劃分:根據(jù)選票模板,將圖像劃分為總統(tǒng)候選人區(qū)、參議員區(qū)、公投議題區(qū)等獨(dú)立 ROI。
填涂分析:對(duì)每個(gè)候選人對(duì)應(yīng)的橢圓填涂框,計(jì)算黑色像素占比,超過(guò) 35% 則判定為有效投票。
異常標(biāo)記處理:若同一總統(tǒng)候選人區(qū)檢測(cè)到 2 個(gè)及以上有效填涂,系統(tǒng)標(biāo)記為 “多選票”(overvote),該區(qū)域投票無(wú)效。
數(shù)據(jù)同步:每臺(tái)讀票機(jī)實(shí)時(shí)將計(jì)數(shù)結(jié)果通過(guò)加密網(wǎng)絡(luò)傳輸至選區(qū)服務(wù)器,同時(shí)保存原始圖像供事后審計(jì)(如 2020 年佐治亞州重新計(jì)票時(shí),人工核對(duì)了掃描圖像與紙質(zhì)選票)。
全流程質(zhì)量控制節(jié)點(diǎn)
階段 具體措施
選舉前 - 模擬測(cè)試:用至少 1000 張包含各類(lèi)邊緣場(chǎng)景的模擬選票(如重度折疊票、墨水滲透票、輕微填涂票)進(jìn)行壓力測(cè)試,識(shí)別錯(cuò)誤率需<0.01% 方可上線。
- 第三方認(rèn)證:通過(guò)國(guó)際標(biāo)準(zhǔn)(如美國(guó) FEC 的投票系統(tǒng)認(rèn)證、ISO 25010 軟件質(zhì)量模型)的合規(guī)性審計(jì)。
選舉中 - 實(shí)時(shí)異常報(bào)警:當(dāng)連續(xù) 5 張選票出現(xiàn) “多選” 或 “空白票” 比例超過(guò)歷史均值 2 倍時(shí),系統(tǒng)自動(dòng)暫停并提示工作人員檢查(如巴西大選讀票機(jī)的實(shí)時(shí)監(jiān)控 dashboard)。
- 雙人員工值守:每臺(tái)讀票機(jī)需 2 名選舉工作人員同時(shí)在場(chǎng),一人操作、一人復(fù)核,避免單人誤操作。
選舉后 - 人工抽樣審計(jì):按選區(qū)隨機(jī)抽取 5%-10% 的紙質(zhì)選票與掃描數(shù)據(jù)比對(duì),誤差率超過(guò) 0.5% 時(shí)啟動(dòng)全量重新計(jì)票(如 2020 年美國(guó)亞利桑那州審計(jì)中,人工復(fù)核 5000 張選票,機(jī)器計(jì)數(shù)準(zhǔn)確率為 99.87%)。
- 審計(jì)日志留存:記錄每臺(tái)讀票機(jī)的開(kāi)機(jī)時(shí)間、掃描張數(shù)、異常處理記錄等,保存至少 22 個(gè)月(符合美國(guó) HAVA 法案要求)。