De la statistique pour détecter la fraude fiscale

Proposé par
le
dans

La loi de Benford est une loi statistique utilisée notamment pour détecter les fraudes fiscales. Se basant sur des observations empiriques, cette loi veut que lorsque l'on observe les nombres d'une déclaration fiscale par exemple, on doit avoir bien plus souvent comme premier chiffre d'un nombre le chiffre 1 que les autres. Si ce n'est pas le cas, cela peut laisser penser que certains nombres ont été trafiqués.


Tous les commentaires (44)

a écrit : Je suis désolé mais je n ai rien compris... Mon non plus...pourquoi 1 pas 9?

Posté le

android

(2)

Répondre

a écrit : J'ai ri!
30k de salaire par ans.
C'est vraiment le chiffre pour b**ser tout le monde à faire croire qu'on a tous de l'argent en masse.
Il ne faut en aucun cas se fier à la moyenne (sur ce point de vu ) mais à la mediane qui là est en dessous des 2K par mois.

Et pour in
fo la mediane c'est le chiffre qui va nous dire 50% de la population à plus et 50 à moins.

Faut faire attentions aux amalgames.

www.latribune.fr/actualites/economie/france/20141216tribe5a5aab3c/le-salaire-net-median-mensuel-s-eleve-a-1-730-euros.html
Afficher tout
Faut aussi lire jusqu'au bout : le commentaire d'origine disait justement qu'il vaut mieux utiliser la médiane et pourquoi.

Posté le

android

(10)

Répondre

a écrit : "Bien plus souvent" ne me paraît quand même pas bien tangible comme probabilité que la loi soit correcte. Les méthodes d'expertise sont plus sûres à mon avis. La frequence d'apparition du 1 doit être proche de 30% pour être plus précis :)

a écrit : Je pense que comme tout le monde j'ai fouillé dans mes souvenirs de la dernière fiche d'impos. Je dois être victime d'une fraude.
Mais qu'est ce qui explique cette tendance ?
C'est psk la frequence d'apparition du premier chiffre suit une loi logarithmique (je crois) et non une loi uniforme sur {1,...,9}. Le 1 devrait apparaître avec un frequence d'environ 30% par exemple.

a écrit : Je suis désolé mais je n ai rien compris... En gros quand tu regardes un nombre dans une liasse fiscale, tu verras que dans environ 30% des cas, le premier chiffre non nul(en partant de la gauche) est un 1. C'est la même chose si tu regardes les nombres dans un journal, les cours de la bourse ou encore les population dans le monde.

a écrit : J'ai ri!
30k de salaire par ans.
C'est vraiment le chiffre pour b**ser tout le monde à faire croire qu'on a tous de l'argent en masse.
Il ne faut en aucun cas se fier à la moyenne (sur ce point de vu ) mais à la mediane qui là est en dessous des 2K par mois.

Et pour in
fo la mediane c'est le chiffre qui va nous dire 50% de la population à plus et 50 à moins.

Faut faire attentions aux amalgames.

www.latribune.fr/actualites/economie/france/20141216tribe5a5aab3c/le-salaire-net-median-mensuel-s-eleve-a-1-730-euros.html
Afficher tout
C'est bien juste il ne faut pas faire d'amalgame.
Il ne faut pas faire d'amalgame entre un salaire individuel mensuel et le revenu annuels d'un ménage.
En déclarant les impôts d'un ménage, il peut y avoir plusieurs salaires. Or l'anecdote parle bien d'impôts et non de salaires individuels, d'où mon commentaire d'origine.
D'autre part, j'ai déjà mentionné la médiane et pourquoi il faut plus s'y fier plutôt qu'à la moyenne.

a écrit : Je suis désolé mais je n ai rien compris... Ca me rassure enormement car moi non plus! J'ai declaré 2****euros et pourtant j'ai rien fraudé!!!!!!!

La source indique que cette loi a été démontrée pour des nombres qui ne dépendent pas d'une unité de mesure : on doit trouver le 1 comme premier chiffre dans 30% des cas. En revanche pour la taille d'un homme adulte par exemple on trouvera un 1 dans plus de 90% des cas si elle est en cm et si elle est en pieds on ne trouvera jamais de 1, donc ça dépend de l'unité de mesure et elle ne s'applique pas. Pour les déclarations fiscales qui dépendent de la devise (franc, euro, etc.), on ne trouvera pas forcément des 1 mais une fois qu'on a établi quelle est la fréquence à laquelle on trouve les différents chiffres dans les déclarations, on peut espérer détecter les fraudes par l'analyse du premier chiffre des nombres car les fraudeurs vont mettre des chiffres qui ne respectent pas la distribution statistique habituelle des autres déclarations.

Petit rectificatif, cette loi mathématique n'est pas valable uniquement pour le 1er chiffre, elle s'applique à tout chiffre d'une mesure physique. Les 1 apparaissent plus que les 2, que les 3, etc jusqu'au 0 qui est le chiffre apparaissant le moins. Cette loi se vérifie sur le nombre lui même et toutes ses décimales.
La loi se vérifie toujours, que l'on change l'unité de mesure, et même la base de mesure ( on abandonne la base décimale pour passer en base 8, etc... En base 2 on aura beaucoup plus de 1 que de 0).
Attention, s'agissant d'une loi statistique, elle ne s'applique qu'à un nombre important de chiffres, par exemple des livres de comptes de société avec des centaines de nombre à donner.
Enfin dernière précision, cette loi s'applique pour toute mesure, pas aux nombres "existant" hors d'une mesure, par exemple à ma connaissance les décimales de pi ne suivent pas cette loi.

a écrit : Petit rectificatif, cette loi mathématique n'est pas valable uniquement pour le 1er chiffre, elle s'applique à tout chiffre d'une mesure physique. Les 1 apparaissent plus que les 2, que les 3, etc jusqu'au 0 qui est le chiffre apparaissant le moins. Cette loi se vérifie sur le nombre lui même et toutes ses décimales.
La loi se vérifie toujours, que l'on change l'unité de mesure, et même la base de mesure ( on abandonne la base décimale pour passer en base 8, etc... En base 2 on aura beaucoup plus de 1 que de 0).
Attention, s'agissant d'une loi statistique, elle ne s'applique qu'à un nombre important de chiffres, par exemple des livres de comptes de société avec des centaines de nombre à donner.
Enfin dernière précision, cette loi s'applique pour toute mesure, pas aux nombres "existant" hors d'une mesure, par exemple à ma connaissance les décimales de pi ne suivent pas cette loi.
Afficher tout
Heu... Tu es sûr que nous avons lu la même source ? La source en lien dit que ça s'applique uniquement au premier chiffre et éventuellement un peu au suivant et qu'ensuite la distribution est aléatoire. Et elle dit aussi que ça marche pour les comptages mais pas pour les nombres qui dépendent d'une unité de mesure (comme je viens de le dire dans mon commentaire précédent avec l'exemple de la mesure d'un adulte). C'est à dire exactement le contraire de ce que tu affirmes. Dans le doute je préfère croire la source plutôt qu'un simple commentaire publié par un inconnu !

Cette loi s'applique sur casiment tout. De la longueur des fleuves d'un pays aux résultats Google : faites le test, tapez "1" puis "2" ainsi de suite et regardez le nombre de résultats !

Posté le

android

(2)

Répondre

a écrit : D'après l'INSEE, le revenu moyen par ménage en 2013 (les revenus de 2014 ne sont pas sur le site d'après mes recherches) est de 35 950€. On est loin des revenus commençant par 1...
Et même si on le prend mensuellement, c'est bien plus que 1.
Pour éviter de fausser les chiffres par des s
alaires mirobolants qui feraient monter la moyenne, on peut utiliser les revenus médians qui étaient en 2013 de 29 540€.

www.insee.fr/fr/themes/tableau.asp?reg_id=0&ref_id=NATSOS04202
Afficher tout
Puisqu'ici il est question du revenu moyen par ménage, 35 950€ correspond au salaire de deux personnes dans la majorité des cas, non? Et dans ce cas on aurait bien affaire à des salaires commençant par un 1. Bien sûr il faut prendre en compte les personnes vivant seules ou les ménages avec plus de deux salaires, mais je ne pense pas que la moyenne française par personne soit aussi élevée!

a écrit : D'après l'INSEE, le revenu moyen par ménage en 2013 (les revenus de 2014 ne sont pas sur le site d'après mes recherches) est de 35 950€. On est loin des revenus commençant par 1...
Et même si on le prend mensuellement, c'est bien plus que 1.
Pour éviter de fausser les chiffres par des s
alaires mirobolants qui feraient monter la moyenne, on peut utiliser les revenus médians qui étaient en 2013 de 29 540€.

www.insee.fr/fr/themes/tableau.asp?reg_id=0&ref_id=NATSOS04202
Afficher tout
Mais par ménage ca veut pas dire pour 2 personnes, un couple? Du coup on divise 35000€ par 2 nan? Du coup 17500€ par personne c'est plutot une bonne moyenne nan? Enfin c'est plausible, les gens gagnent plus ou moins ça (plutot moins snif snif lol). Ou alors j'ai rien compris? Si c'est 35000€ en moyenne par personne ben je serais loin de me plaindre avec ce salaire haha.

a écrit : J'ai ri!
30k de salaire par ans.
C'est vraiment le chiffre pour b**ser tout le monde à faire croire qu'on a tous de l'argent en masse.
Il ne faut en aucun cas se fier à la moyenne (sur ce point de vu ) mais à la mediane qui là est en dessous des 2K par mois.

Et pour in
fo la mediane c'est le chiffre qui va nous dire 50% de la population à plus et 50 à moins.

Faut faire attentions aux amalgames.

www.latribune.fr/actualites/economie/france/20141216tribe5a5aab3c/le-salaire-net-median-mensuel-s-eleve-a-1-730-euros.html
Afficher tout
30k de l'argent en masse ? Lol

Posté le

android

(5)

Répondre

a écrit : Heu... Tu es sûr que nous avons lu la même source ? La source en lien dit que ça s'applique uniquement au premier chiffre et éventuellement un peu au suivant et qu'ensuite la distribution est aléatoire. Et elle dit aussi que ça marche pour les comptages mais pas pour les nombres qui dépendent d'une unité de mesure (comme je viens de le dire dans mon commentaire précédent avec l'exemple de la mesure d'un adulte). C'est à dire exactement le contraire de ce que tu affirmes. Dans le doute je préfère croire la source plutôt qu'un simple commentaire publié par un inconnu ! Afficher tout Bon en fait mes souvenirs m'ont trahi, la loi ne s'applique effectivement pas à tous les chiffres du nombre. Elle s'applique par contre auX premierS chiffreS significatifS en s'atténuant progressivement pour une distribution quasiment équiprobable à partir du 5ème chiffre. J'ai dû retrouver mon numéro spécial de le revue ''la recherche'' d'aout 1999 pour retrouver ces données.
Toutes mes autres remarques sont elles parfaitement justes. J'ajoute que la multiplication de ces chiffres par une variable quelconque ( par exemple une conversion dans une autre échelle, passer en pieds ce qui était en mètres, n'empêche pas à le loi de jouer son rôle.
Au fait, la loi s'appelle loi de Benford car les travaux de Newcomb qui le premier l'avait énoncé 50 ans plus tôt avaient été oubliés.

a écrit : Heu... Tu es sûr que nous avons lu la même source ? La source en lien dit que ça s'applique uniquement au premier chiffre et éventuellement un peu au suivant et qu'ensuite la distribution est aléatoire. Et elle dit aussi que ça marche pour les comptages mais pas pour les nombres qui dépendent d'une unité de mesure (comme je viens de le dire dans mon commentaire précédent avec l'exemple de la mesure d'un adulte). C'est à dire exactement le contraire de ce que tu affirmes. Dans le doute je préfère croire la source plutôt qu'un simple commentaire publié par un inconnu ! Afficher tout En fait il a raison,on peut définir une autre loi pour le second chiffre, encore une autre pour le 3e etc... La fréquence d'apparition sera differente. :) J'ai voulu publier ça dans le texte mais l'anecdote a été modifiée par les moderateurs pour qu'elle soit plus courte et compréhensible pat tout le monde.

a écrit : Bon en fait mes souvenirs m'ont trahi, la loi ne s'applique effectivement pas à tous les chiffres du nombre. Elle s'applique par contre auX premierS chiffreS significatifS en s'atténuant progressivement pour une distribution quasiment équiprobable à partir du 5ème chiffre. J'ai dû retrouver mon numéro spécial de le revue ''la recherche'' d'aout 1999 pour retrouver ces données.
Toutes mes autres remarques sont elles parfaitement justes. J'ajoute que la multiplication de ces chiffres par une variable quelconque ( par exemple une conversion dans une autre échelle, passer en pieds ce qui était en mètres, n'empêche pas à le loi de jouer son rôle.
Au fait, la loi s'appelle loi de Benford car les travaux de Newcomb qui le premier l'avait énoncé 50 ans plus tôt avaient été oubliés.
Afficher tout
Il me semble qu'on est quand même capable de définir une loi pour chacun des autres chiffres des nombres étudiés. Les fréquences d'apparition seront différentes. Et merci pour tes précisions qui ne n'ont pas pu passer dans l'anécdote :)

Quand on réfléchis à cette loi avec des exemples simples c est beaucoup plus compréhensible.

Dans une rue de 92 numéros par exemple chaque premier chiffre sera représenté dans 11 % des cas. Dans une rue plus courte de 40 numéros par exemple chaque chiffre apparaîtra en première position dans 25 % des cas.

A l'arrivée on se rend bien compte que le chiffre 1, à la différence des autres est toujours représenté même dans les rues les plus courtes, qui ne comptent que quelques maisons.

On comprend donc bien que plus le premier chiffre est faible plus il a de chance d'apparaître, et ça sans compter que les rues très courtes sont certainement plus nombreuses que les rues très longues.

a écrit : "Bien plus souvent" ne me paraît quand même pas bien tangible comme probabilité que la loi soit correcte. Les méthodes d'expertise sont plus sûres à mon avis. "Bien plus souvent" est estimé à 33% dans la loi de Benford.

a écrit : J'ai ri!
30k de salaire par ans.
C'est vraiment le chiffre pour b**ser tout le monde à faire croire qu'on a tous de l'argent en masse.
Il ne faut en aucun cas se fier à la moyenne (sur ce point de vu ) mais à la mediane qui là est en dessous des 2K par mois.

Et pour in
fo la mediane c'est le chiffre qui va nous dire 50% de la population à plus et 50 à moins.

Faut faire attentions aux amalgames.

www.latribune.fr/actualites/economie/france/20141216tribe5a5aab3c/le-salaire-net-median-mensuel-s-eleve-a-1-730-euros.html
Afficher tout
Enfin quelqu'un de censé puisque 35k€ de revenus annuel ça ne choquait personne !!