חוק בנפורד (חוק הסיפרה הראשונה) קובע שבמערכי נתונים רבים הספרות הראשונות (1, 2 וכו') יופיעו בשכיחות גבוהה, למשל 30% מהנתונים יתחילו בסיפרה 1. חוק זה משמש לזיהוי מניפולציה של נתונים ובדיקת אמינות של מאגרי מידע.
מאמר זה מציע הסבר לחוק וסוקר כמה מהיישומים המעניינים של חוק בנפורד, למשל:
- זיהוי מניפולציות והונאות בדיווחים פיננסיים והצהרות הון
- בדיקת אמיתות ושקיפות של הוצאות כספיות שדווחו ע"י גופים מוניציפליים
- זיהוי זיופים בנתוני המצביעים בבחירות לנשיאות ארה"ב
- זיהוי התקפות סייבר ופגיעות של האקרים ברשת החשמל
- בדיקת דיווחים של מדינות על דיג מסחרי של לווייתנים באוקיינוס השקט
- אימות דאטה בתעשיה בעקבות חששות לזיופים בנתונים שמגיעים מסין
- ניתוח תדירות התווים לצורך השוואה בין יצירות מוסיקליות
- בקרה על נתוני הקורונה שמדווחים ע"י מדינות שונות