La protection de la vie privée sur Internet.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
10-09-2018
Abstract
L’INTERNET devient un moyen de plus en plus indispensable, presque utilisable
dans touts les domaines (communications, commerce, relations sociales, . . . ).
La grande masse d’information qui circule sur Internet ouvre l’appétit de pas mal
de gens et d’entreprises, qui utilisent ces informations hors de leur contexte légitime,
touchant directement à la vie privée des personnes. Les conséquences de
cette utilisation peuvent varier d’une simple collecte d’information qui touche à l’intimité
des personnes, jusqu’au vol d’identité qui induit des conséquences graves et
directes sur la victime, de ce fait, protéger sa vie privée n’est plus une question
d’éthique.
Le but de notre thèse est de faire une étude sur la protection de la vie privée sur
internet. Nous avons choisi de traiter cette problématique sur plusieurs niveaux :
le niveau accès et présentation, le niveau API et services et enfin le niveau stockage
et base de données. Ces niveaux modélisent le cycle de vie des données circulant
sur Internet depuis leur divulgation par les utilisateurs jusqu’à leur utilisation et
stockage par les fournisseurs de services.
Au niveau accès, nous avons traité la problématique de protection des données
personnelles contre l’hameçonnage (le Phishing), le type d’attaque le plus utilisé
sur Internet pour le vol d’identité. A ce niveau nous avons proposé une approche
de lute contre le Phishing. Cette approche se base sur un filtre à deux niveaux :
une liste blanche personnalisée et un classificateur SVM. Les pages de Phishing qui
ne sont pas filtrées au niveau de la liste blanche sont traitées par le classificateur
SVM, ce qui donne une meilleur efficacité.
Au niveau API et services, nous avons traité la protection de la vie privée dans
les services Web. Ce choix est motivé par le rôle central que cette technologie joue
dans le fonctionnement d’Internet. Dans ce contexte, nous avons proposé un Framework
de sélection de services qui préserve les exigences de vie privée des utilisateurs
ainsi que les fournisseurs de services. Pour ce faire, nous avons introduit
un formalisme qui permet de modéliser le problème de sélection sous forme d’un
problème d’optimisation, avec un objectif de minimiser la fonction de risque relatif
à l’utilisation des données privées par les services sélectionnés.
Au niveau stockage, nous nous sommes concentrés sur l’anonymat des données
collectées et stockées chez les fournisseurs de services. Même pour des
raisons légitimes, les données collectées sont généralement partagées et publiées,
ce qui expose les propriétaires de ces données à des risques d’attaques sur leur
vie privée. Dans ce cadre nous avons proposé une approche de protection qui se
base sur la publication des données fictives au lieu de vrais données. Les données
fictives sont générées en utilisant des modèles issues des données originales, et en
se basant sur les techniques de Machine Learning. Les données générées gardent
certaines propriétés des données originales, ce qui assure à la fois une forte protection
et une grande utilité.