數據分析:賓州數據庫缺失百萬選民投票紀錄

文:梅婷

Facebook

【新唐人北京時間2020年11月25日訊】美國各州州政府對待選舉,或多或少都做出擁有透明度的姿態,很多原始數據,官方都願意主動與民眾分享。賓州也不例外,在這個競選舞弊投訴非常多的州,選民的數據資料也是每星期更新一次,每次需付20美元即可下載。

筆者手上拿到四份分別是11月2日、9日、16日,及23日下載的賓州全部選民名單的資料集快照(dataset snapshot),用以對比分析,探尋舞弊投訴是否在數字庫裡有具體的體現。

經過比對發現,截至11月20日,賓州數據庫中記錄參與本次投票的選民人數,與媒體公布的選票總數相差一百多萬。

選民數據庫資料應與選民總數一致

首先介紹一些基本數字:數據庫裡包括九百多萬行登記選民的資料,每個選民的資料包含153項屬性,包括選民編號、人名、地址、黨派、學區、選區、每次選舉分別採用的方式、紀錄更改日等。其中第一個值得注意的是累積投票人總數,這個數據每州的選舉數據庫都應該有,但可能用不同的方式表達。

例如,內華達州選民登記數據集是截止到11月6日晚間,數據庫裡看到一欄屬性是「選舉日」(Election Day),數這一欄有多少個「2020-11-03」就會得到1,394,715個結果,即截至11月6日內華達州已有約139萬選民完成了本次投票。11月15日新聞看到有1,405,376人,內華達州這兩個數字基本算是吻合的。

又例如,華盛頓州允許郵寄投票,筆者所下載的數據庫是截止到11月2日的版本,同樣道理,把「最後一次投票」(LastVoted)那欄裡的「2020-11-03」都加起來得到3,230,733個結果,新聞報導中參與早起投票的選民則為3,545,289人。也就是說,到11月2日為止,華盛頓州數據庫中記載有323萬名選民已經投票,與新聞中說的354萬人也很接近,十分之一的差距可能來自早晚截止時間不同的差距,屬於正常範圍內。

州政府或各新聞機構所報告的參加選舉的選民總數必須和數據庫裡算出總數大致一樣,這是常識,也是以下要談論的重點。

賓州數據庫一直缺少上百萬人投票信息

在賓州的數據庫裡,在153個屬性中,排列#26的屬性 Last Vote Date =’2020-11-03’這一欄擁有類似的內容。如下圖所示:

11月1日,賓州數據庫記錄有240萬人已投票;11月8日,數據庫記錄有372萬人已投票;11月15日,數據庫記錄有447萬人已投票;11月20日,數據庫記錄有585萬人已投票。(數據來源:賓州政府數據庫)

可以看到三星期來累積投票人數是一直在增長,11月1日是2,404,653,11月8日是3,722,445,11月15日是4,472,083,11月20日是5,850,725。

問題來了,以11月15日為例,賓州政府及新聞媒體公布的已投票人數是 6,857,562張選票,其中拜登 3,423,976票,川普 3,354,836票,喬根森(Jo Jorgenson)78,750張。而從數據庫裡只看到4,472,083人已投票,兩份數據相差2,385,479人。如下圖所示:

選舉結束以後,賓州政府數據庫中記錄已投票的人數(黃線)與媒體公布的總票數(藍線)一直有缺口,缺口從11月3日的330萬縮小到了20日的100萬。(數據來源:賓州政府數據庫)

也就是說,到11月15日為止,有238.5萬多張選票來路不明,超過三分之一的選票數據庫里根本沒有紀錄。這也佐證了川普競選團隊數據和策略總監馬特‧布雷納德團隊(Matt Braynard)在11月16日所描述的賓州現象:他們在大選後調查了1137人,其中超過三分之一的人寄了選票,卻無法在政府的驗證網頁上查到已投票的紀錄。

到了11月20日,基本應該已經全部檢查完了,這個缺口還是有一百萬左右。

當數據庫裡的總投票數一直嚴重低於真實的投票數時,意味著什麼呢?

重複投票的隱患

這意味著數據庫裡更新投票日期、拒絕重複投票的功能選擇性失效了;或者新聞報道的已投票數據是虛構的,是虛構了上百萬張選票。

在這裡簡單解釋一下這「更新投票日期」功能在數據庫中的重要性:

正常來說,如果甲投票了,系統掃描進去,數據庫更新了他的投票日子。他出去轉了個圈又跑回來,想再投一次票,投票系統一檢查,「哦,他的投票紀錄已更新為『2020-11-03』了,他已投過票了。」他就不能投票了。

如果三分之一的人在數據庫裡的「更新投票日」這一功能失效,他們就能重複多次投票,系統會一直接受!這樣才能解釋:一面是1137人,超過三分之一的人寄了選票,卻在數據庫裡查不到他們自己已投票(投票日期沒有更新),而另一面州政府那裡點票比數據庫裡多出了超過百萬張選票這種怪異的現象。

將某段時間、某個投票地點、某些選民特定為無需「更新投票日」、這在技術設置層面是非常容易做到的,但這是有差別地對待選民,是違反選舉法的。也使得不法選票可以多次掃入,不被系統拒絕!可以說這是不法選票混入合法選票的通道。

當然,筆者是在做數據庫走向和其功能分析,這裡技術失誤是應該被考慮到的。例如,當機、程序故障、操作不當等,一切技術失誤都可能造成數據的錯亂和丟失,這時數據庫高級管理人員應該立即通知選民暫停選舉,維修後再重選。可是我們沒有查到有這樣的通知。我們有理由懷疑這多出的上百萬張選票中有很多是來路不明的。

「郵寄選票數據集」已做篡改

鑒於賓州政府在《大紀元時報》發表的《賓州選票數據疑點淺析 220歲老人郵寄投票》這篇文章見報後,將該文中公開的「郵寄選票數據集」已做篡改,並且不讓公眾再去下載。再過一兩個星期本文所述的這個數字缺口很可能又會被修補上了。

由此,筆者對賓州政府及其數據庫高級管理人員提出的問題是:你們在大選前後這一個月以來,用什麼機制保證不混入重複選票的?這是個永恆的問題,不是個通過補上數據就能解釋的問題!

假設重新計票,必須用獨立的掃描器記錄所有重新計票的選票上的選民編碼,只要出現重複的選票,就立即作廢。最後若發現合法選票大大少於公布的數據690萬,筆者絕不會吃驚。因為現在賓州數據庫的走勢就是這麼荒誕。

筆者非常鼓勵專業數據人士去研究各選舉問題州的數據庫,發現事實真相找出問題所在。鼓勵下載,留下證據。

每份$20元的賓州官方註冊選民資料集:

https://www.pavoterservices.pa.gov/Pages/PurchasePAFULLVoterExport.aspx

(轉自大紀元/責任編輯:李紅)

相關文章