Examen du lien entre la criminalité et la situation socio-économique à Ottawa et à Saskatoon : Analyse géographique à petite échelle

5. Méthodes d'analyse

5. Méthodes d'analyse

5.1 Plan d'analyse

Le présent rapport est fondé sur trois études distinctes et par conséquent, les méthodes employées dans l'analyse sont légèrement différentes. Elles représentent un calibrage progressif de techniques d'analyse statistique et géographique. L'étude no 1 d'Ottawa est fondée sur des données correspondant à la plus petite unité géographique disponible-l'aire de diffusion (AD). L'étude no 2 de Saskatoon est fondée sur des données s'appliquant à des quartiers. Nous avons employé de nouveau les mêmes méthodes que dans l'étude d'Ottawa, mais nous avons élargi l'analyse géographique de manière à inclure l'auto-corrélation spatiale. Dans l'étude no 3, nous avons ré-agrégé les AD d'Ottawa pour les faire concorder aux limites des quartiers de la ville et nous avons comparé directement les résultats de cette analyse à ceux de l'analyse des quartiers de Saskatoon.

Section 5.2 - Méthodes d'analyse statistique et géographique

Statistique descriptive

Dans les trois études, les variables liées à l'acte criminel ont été soumises à des calculs de manière à obtenir un taux pour 1 000 habitants en fonction de l'unité géographique d'analyse (AD ou quartiers). Toutes les variables de recensement et les variables socio-économiques des trois études ont été calculées selon l'échelle proportionnelle, sauf les variables liées au revenu moyen et à la valeur des habitations, qui ont été laissées à l'échelle d'intervalle. Nous avons calculé les statistiques descriptives pour chaque ensemble de données de manière à déterminer les valeurs minimales, maximales et moyennes ainsi que l'écart-type et le coefficient de variation de chaque variable.

Transformation des variables

Aux fins de l'analyse statistique et  pour respecter les hypothèses de base et les contraintes du modèle linéaire général, nous avons transformé chacune des variables de l'acte criminel et des variables socio-économiques employées dans les trois études en un score Z pour chaque unité géographique d'analyse (AD ou quartier). La formule de cette transformation est la suivante :

Zi  =( xi - x ) / sdx

(où Zi est le score Z, xi est la valeur originale, x est la moyenne de toutes les valeurs de x et sd est l'écart-type de cette moyenne).

Après la transformation, chaque variable a donc une moyenne de 0 et un écart-type de 1, ce qui permet d'évaluer la position relative de chaque cas (AD ou quartier). Par exemple, les secteurs à haut taux de criminalité auront un score Z supérieur à 0 tandis que les secteurs à faible taux de criminalité auront des valeurs inférieures à 0. Cette normalisation ramène sur la même échelle des variables utilisant des unités de mesure différentes et elle procure la justification quantitative d'analyses statistiques plus approfondies, en particulier pour l'analyse multidimensionnelle. Ce genre de transformation est courant dans les études sur la criminalité et Fitzgerald, Wisener et Savoie (2004) l'ont employé récemment dans une étude de Winnipeg.

Analyse des composantes principales

Chacune des trois études a comporté l'exécution d'une analyse des composantes principales (ACP) sur leurs ensembles de données respectifs afin d'examiner la relation statistique entre la criminalité et la situation socio-économique à Ottawa et à Saskatoon. Essentiellement, l'ACP est une technique de réduction des données. Elle remplace un ensemble de variables par un plus petit nombre de composantes, lesquelles sont constituées de variables corrélées représentant la plus grande partie possible de l'ensemble de données original. L'analyse des composantes principales est une technique adaptée à une recherche inductive de caractéristiques communes à l'égard de la criminalité et de la situation socio-économique dans une région urbaine au moyen de statistiques liées à de petites unités géographiques. Hung (2002) et Mata (2003) ont utilisé cette technique dans leur recherche sur la criminalité.

Régression multiple

L'analyse de régression multiple est une technique multidimensionnelle qui évalue la relation entre au moins deux variables indépendantes et une variable dépendante. On l'utilise pour décrire la contribution individuelle de plusieurs variables indépendantes afin de prédire le comportement d'une variable dépendante (McKean et Byers, 2000). Aux fins de la présente recherche, nous avons soumis les ensembles de données des trois études à des analyses de régression multiple afin d'examiner la force et l'intensité de la relation entre la criminalité (la variable dépendante) et les situations socio-économiques (les variables indépendantes) et de repérer des « indicateurs » utiles de la criminalité à Ottawa et à Saskatoon. Nous avons mis à l'épreuve les modèles de régression multiple standard et séquentielle pour chacune des variables de la criminalité employées dans les études (y compris la criminalité totale, les crimes de violence, les crimes majeurs contre les biens, les crimes mineurs contre les biens et les infractions relatives aux stupéfiants).

Analyse cartographique et analyse fondée sur le SIG

Pour chacune des trois études, nous avons produit une série de cartes afin d'illustrer la répartition géographique de la criminalité à Ottawa et à Saskatoon et pour examiner la relation spatiale entre la criminalité et certaines conditions socio-économiques dans les deux villes. Nous avons employé le logiciel ArcGIS (ESRI, http://www.esri.com) à cette fin. Dans l'étude no 1, le service de police d'Ottawa (SPO) a fourni des données sur la criminalité en 2001 pour les 1 187 aires de diffusion de la ville. Nous avons ensuite combiné ces données et les données du Recensement de 2001 avec le fichier cartographique numérique de Statistique Canada pour Ottawa. Dans l'étude no 2, nous avons obtenu du service d'urbanisme de la ville de Saskatoon un fichier cartographique numérique montrant les 55 quartiers résidentiels de Saskatoon. Nous avons ensuite combiné ces données géographiques avec les données sur la criminalité en 2003, les données du Recensement de 2001 et d'autres données sur l'aménagement/urbanisme de la ville. Dans l'étude no 3, nous avons obtenu un fichier cartographique numérique du service d'urbanisme de la ville d'Ottawa qui illustre les 50 quartiers résidentiels d'Ottawa. Tel que mentionné, nous avons ré-agrégé les données sur la criminalité et les données du recensement employées dans l'étude no 1 de manière qu'elles correspondent aux limites de ces quartiers.

Nous avons produit des cartes choroplèthes dans chacune des trois études. On utilise ce type de carte quand la quantité applicable à l'unité géographique est représentée par la couleur ou l'ombre du symbole de l'aire indiquée dans l'unité de dénombrement - en l'occurrence, l'AD ou le quartier. Comme Dent (2000, p. 5) l'explique, l'utilisation des cartes choroplèthes implique plusieurs hypothèses. Premièrement, on suppose que la quantité illustrée est uniforme dans l'aire de dénombrement. Deuxièmement, on suppose que les densités, les taux ou les rapports sont plus importants que les valeurs absolues. Étant donné que la taille des aires de dénombrement varie, le fait de symboliser des valeurs absolues par des symboles d'aire ombrée peut engendrer des erreurs d'interprétation. Compte tenu que toutes les données liées à la criminalité et les données socio-économiques employées dans les trois études sont agrégées de manière à correspondre à des limites géographiques, nous avons jugé que la cartographie choroplèthe est celle qui convenait le mieux. La classification cartographique est fondée sur des intervalles d'intensité de la criminalité. Dans l'étude no 1, les secteurs à haut taux de criminalité dans les AD d'Ottawa ont été cartographiés selon trois catégories - élevée, haute et la plus haute - en fonction de leur valeur Z. Dans les études 2 et 3, les taux de criminalité pour 1 000 habitants dans les quartiers d'Ottawa et de Saskatoon sont cartographiés selon cinq catégories, allant des taux de criminalité les plus faibles aux plus élevés pour 1 000 habitants.

Auto-corrélation spatiale

Nous n'avons employé l'auto-corrélation spatiale que dans l'étude de Saskatoon (étude no 3). Il est évident que si des techniques statistiques comme l'analyse de régression multiple et l'analyse des composantes principales sont utiles dans les études sur la criminalité, elles sont de nature non spatiale. Par ailleurs, si la cartographie est utile pour illustrer les configurations géographiques de la criminalité et de la situation socio-économique, la visualisation n'est pas en soi une approche explicitement spatiale. Par conséquent, nous avons employé la technique de l'auto-corrélation spatiale dans l'étude de Saskatoon afin de déterminer directement la présence de caractéristiques spatiales dans les variables cartographiées en fonction de la proximité géographique. Comme Johnston et ses collègues (2000, p.775) l'expliquent :

[traduction] La forme la plus courante d'auto-corrélation spatiale existe lorsque des valeurs similaires pour une variable ont tendance à se grouper dans des unités d'observation adjacentes, de telle façon qu'en moyenne dans l'ensemble de la carte, les valeurs voisines sont plus similaires qu'elles ne le seraient si l'affectation des valeurs à des unités d'observation était le fruit d'un mécanisme purement aléatoire.

Autrement dit, l'auto-corrélation spatiale sert à déterminer des grappes d'association étroite des variables et nous l'avons employée dans la présente étude pour évaluer le niveau de concentration géographique de la criminalité à Saskatoon ainsi que la relation spatiale entre la criminalité et les caractéristiques des quartiers.

Nous avons employé le logiciel CrimeStat, mis au point par Levine & Associates (2002) pour calculer la valeur « I » de Moran, l'un des indicateurs d'auto-corrélation spatiale les plus couramment utilisés. Le I de Moran (Moran, 1950) est également l'une des statistiques spatiales les plus anciennes et elle est appliquée à des secteurs ou à des points auxquels des variables continues sont associées (intensités). La valeur est calculée comme suit :

I = N ∑ij W0 (Xi - X)( Xj - X) / (∑ij W0) (Xi - X)2

où N est le nombre de cas, Xi est la valeur de la variable à un endroit précis, i, Xj est la valeur de la variable à un autre endroit, j, 0 est a moyenne de la variable et Wij est une pondération de la distance appliquée à la comparaison entre l'endroit i et l'endroit j. La statistique est interprétée à peu près comme un coefficient de corrélation, les valeurs proches de +1 indiquant une tendance spatiale forte (les valeurs élevées étant situées près les unes des autres et les valeurs faibles étant situées près les unes des autres) et les valeurs proches de -1 indiquant une auto-corrélation spatiale négative forte. Le degré de signification du I de Moran est calculé comme suit :

Z(I) = I - E(I) / SE(I)f

où I est la valeur empirique calculée à partir d'un échantillon, E (I) est la moyenne théorique d'une distribution aléatoire et SE(I) est l'écart-type théorique de E(I).

CrimeStat utilise des points localisés pour calculer les statistiques d'auto-corrélation spatiale. Le programme nécessite la saisie de valeurs X et Y sous la forme d'un système de coordonnées projetées. Par conséquent, nous avons utilisé ArcGIS pour calculer les coordonnées X et Y (et non la longitude et la latitude) du point central de chacun des 55 quartiers résidentiels de Saskatoon. Pour calculer le I de Moran, CrimeStat nécessite également l'association de valeurs d'intensité à chaque point. En l'occurrence, les valeurs d'intensité étaient les scores Z (à ne pas confondre avec le coefficient de signification Z) pour les cinq catégories d'actes criminels et les trois variables socio-économiques retenues dans les 55 quartiers.