Applying ML and AI to Image Processing
تطبيق ML و AI لمعالجة الصور
Application de ML et AI au traitement d'images

When you look at a satellite image, it’s not always easy to know if you are looking at trees or grass… or roads vs buildings. So imagine how hard it would be for a computer to know.

عندما تنظر إلى صورة قمر صناعي ، ليس من السهل دائمًا معرفة ما إذا كنت تنظر إلى الأشجار أو العشب ... أو الطرق مقابل المباني. لذا تخيل مدى صعوبة معرفة الكمبيوتر.

Lorsque vous regardez une image satellite, il n’est pas toujours facile de savoir si vous regardez des arbres ou de l’herbe… ou des routes par rapport à des bâtiments. Imaginez donc combien il serait difficile pour un ordinateur de savoir.


Support Vector Machine (SVM) is a machine learning technique that takes classified data and looks at the extremes. Next, it draws a decision boundary line based on the data called a “hyperplane”. And the data points that the “hyperplane” margin pushes up against are the “support vectors”.

Support Vector Machine (SVM) هي تقنية تعلم الآلة التي تأخذ بيانات سرية وتبحث في الحدود القصوى. بعد ذلك ، يرسم خط حدود القرار بناءً على البيانات المسماة "hyperplane". ونقاط البيانات التي يدفعها الهامش "hyperplane" هي "متجهات الدعم".

Support Vector Machine (SVM) est une technique d'apprentissage automatique qui prend des données classifiées et examine les extrêmes. Ensuite, il trace une ligne de délimitation de décision basée sur les données appelées «hyperplan». Et les points de données contre lesquels la marge «hyperplan» pousse sont les «vecteurs de support».


And “support vectors” are what’s important because they are the data points that are closest to the opposing classes. Because these points are the only ones considered, all other training points can be ignored in the model. Essentially, you feed SVM training samples of trees and grass. Based on this training data, it builds the model generating a decision boundary of its own.

و "متجهات الدعم" هي الشيء المهم لأنها نقاط البيانات الأقرب إلى الطبقات المتعارضة. نظرًا لأن هذه النقاط هي النقاط الوحيدة التي تم النظر فيها ، يمكن تجاهل جميع نقاط التدريب الأخرى في النموذج. في الأساس ، يمكنك إطعام عينات تدريب SVM من الأشجار والعشب. بناءً على بيانات التدريب هذه ، تقوم ببناء النموذج الذي يولد حدود قرار خاصة به.

Et les "vecteurs de support" sont ce qui est important car ce sont les points de données les plus proches des classes opposées. Étant donné que ces points sont les seuls pris en compte, tous les autres points d'apprentissage peuvent être ignorés dans le modèle. Essentiellement, vous nourrissez des échantillons d'entraînement d'arbres et d'herbe SVM. Sur la base de ces données de formation, il construit le modèle générant une frontière de décision qui lui est propre.


Now, the results of this supervised classification aren’t perfect and algorithms still have a lot more learning to do. We still need work on features like roads, wetlands and buildings. As algorithms get more training data, it will eventually improve to classify anywhere.

الآن ، نتائج هذا التصنيف الخاضع للإشراف ليست مثالية ولا تزال الخوارزميات لديها الكثير لتعلمه. ما زلنا بحاجة إلى العمل على ميزات مثل الطرق والأراضي الرطبة والمباني. مع حصول الخوارزميات على المزيد من بيانات التدريب ، ستتحسن في النهاية إلى التصنيف في أي مكان.

Maintenant, les résultats de cette classification supervisée ne sont pas parfaits et les algorithmes ont encore beaucoup à apprendre. Nous avons encore besoin de travaux sur des éléments comme les routes, les zones humides et les bâtiments. Au fur et à mesure que les algorithmes obtiennent plus de données de formation, il sera éventuellement amélioré de classer n'importe où.



Prediction Using Empirical Bayesian Kriging (EBK):

التنبؤ باستخدام التجريبية Bayesian Kriging (EBK):

Prédiction utilisant le krigeage bayésien empirique (EBK):


As you may know, kriging interpolation predicts unknown values based on spatial pattern. It estimates weights based on the variogram. And quality of the estimate surface is reflected in the quality of the weights. More specifically, you want weights that give an unbiased prediction and the smallest variance. Unlike kriging that fits one whole model for an entire data set, EBK kriging simulates at least one hundred local models by sub-setting the whole data set. Because the model can morph itself locally to fit each individual semi-variogram using kriging methodology, it overcomes the challenge of stationarity. In Empirical Bayesian Kriging (EBK), it predicts over and over again using a variety of simulations up to a hundred times. Each semi-variogram varies from each other. In the end, it mixes all of the semi-variograms for a final surface. You can’t customize as you can with traditional kriging. Finally, it outputs what it thinks is the best solution. Like a Monte Carlo analysis, it runs it repeatedly for you in the background. If it’s a random process, you let the random process run out over a thousand times. You see the trends in the resulting data and use that to justify your selection. This is why EBK almost always predicts better than straight kriging.

كما تعلمون ، يتنبأ الاستيفاء المتراكم بقيم غير معروفة بناءً على النمط المكاني. ويقدر الأوزان بناء على متغير. وتنعكس جودة السطح المقدر في جودة الأوزان. بشكل أكثر تحديدًا ، تريد الأوزان التي تعطي تنبؤًا غير متحيز وأقل اختلاف. على عكس kriging الذي يناسب نموذجًا واحدًا كاملًا لمجموعة بيانات كاملة ، يحاكي EBK kriging ما لا يقل عن مائة نموذج محلي عن طريق إعداد مجموعة البيانات بأكملها بشكل فرعي. نظرًا لأن النموذج يمكن أن يتحول محليًا ليتناسب مع كل شبه فاريوغرام فردي باستخدام منهجية kriging ، فإنه يتغلب على التحدي المتمثل في الثبات. في التطبيق التجريبي Bayesian Kriging (EBK) ، يتنبأ مرارًا وتكرارًا باستخدام مجموعة متنوعة من عمليات المحاكاة تصل إلى مائة مرة. كل شبه متغاير يختلف عن الآخر. في النهاية ، يمزج بين جميع الأشكال شبه المتغايرة لسطح نهائي. لا يمكنك تخصيص ما يمكنك مع التصفيق التقليدي. أخيرًا ، فإنه ينتج ما يعتقد أنه الحل الأفضل. مثل تحليل مونت كارلو ، يتم تشغيله بشكل متكرر لك في الخلفية. إذا كانت عملية عشوائية ، فستترك العملية العشوائية تنفد أكثر من ألف مرة. ترى الاتجاهات في البيانات الناتجة واستخدام ذلك لتبرير اختيارك. هذا هو السبب في أن بنك EBK يتنبأ دائمًا بشكل أفضل من الضربات المستقيمة.

Comme vous le savez peut-être, l'interpolation de krigeage prédit des valeurs inconnues en fonction du modèle spatial. Il estime les poids en fonction du variogramme. Et la qualité de la surface estimée se reflète dans la qualité des poids. Plus précisément, vous voulez des poids qui donnent une prédiction non biaisée et la plus petite variance. Contrairement au krigeage qui s'adapte à un modèle entier pour un ensemble de données entier, le krigeage EBK simule au moins cent modèles locaux en sous-définissant l'ensemble de données entier. Parce que le modèle peut se transformer localement pour s'adapter à chaque semi-variogramme individuel en utilisant la méthodologie de krigeage, il surmonte le défi de la stationnarité. Dans Emigical Bayesian Kriging (EBK), il prédit encore et encore en utilisant une variété de simulations jusqu'à une centaine de fois. Chaque semi-variogramme varie les uns des autres. Au final, il mélange tous les semi-variogrammes pour une surface finale. Vous ne pouvez pas personnaliser comme vous le pouvez avec le krigeage traditionnel. Enfin, il génère ce qu'il pense être la meilleure solution. Comme une analyse Monte Carlo, il l'exécute à plusieurs reprises pour vous en arrière-plan. S'il s'agit d'un processus aléatoire, vous laissez le processus aléatoire s'exécuter plus de mille fois. Vous voyez les tendances dans les données résultantes et utilisez-les pour justifier votre sélection. C'est pourquoi EBK prédit presque toujours mieux que le krigeage droit.



Image Segmentation and Clustering with K-means:

تجزئة الصور وتجميعها باستخدام الوسائل K:

Segmentation et regroupement d'images avec K-means:


By far, the K-means algorithm is one of the most popular methods of clustering data. In K-means segmentation, it groups unlabeled data into the number of groups represented by the variable K. This unsupervised learning approach iteratively assigns each data point into one of the K groupings based on similarity of features. For example, similarity can be based on spectral characteristics and location. In an unsupervised classification, the k-means algorithm first segments the image for further analysis. Next, each cluster is assigned a land cover class. However, GIS can use clustering in other unique ways. For example, data points could represent crime and you may want to cluster hot and low spots of crime. Alternatively, you may want to segment based on socioeconomic, health or environmental (like pollution) characteristics.

إلى حد بعيد ، تعد خوارزمية K- أحد أكثر الطرق شيوعًا في تجميع البيانات. في تجزئة K-mean ، تقوم بتجميع البيانات غير المسماة في عدد المجموعات التي يمثلها المتغير K. يقوم نهج التعلم غير الخاضع للإشراف بتخصيص كل نقطة بيانات في إحدى مجموعات K استنادًا إلى تشابه الميزات. على سبيل المثال ، يمكن أن يستند التشابه إلى الخصائص الطيفية والموقع. في التصنيف غير الخاضع للإشراف ، تقوم خوارزمية k- أولاً بتقطيع الصورة لمزيد من التحليل. بعد ذلك ، يتم تعيين كل مجموعة فئة الغطاء الأرضي. ومع ذلك ، يمكن لـ GIS استخدام التجميع بطرق فريدة أخرى. على سبيل المثال ، يمكن أن تمثل نقاط البيانات جريمة وقد ترغب في تجميع النقاط الساخنة والمنخفضة من الجرائم. بدلاً من ذلك ، قد ترغب في التجزئة بناءً على الخصائص الاجتماعية والاقتصادية أو الصحية أو البيئية (مثل التلوث).

De loin, l'algorithme K-means est l'une des méthodes les plus populaires de regroupement des données. Dans la segmentation K-means, il regroupe les données non étiquetées dans le nombre de groupes représentés par la variable K. Cette approche d'apprentissage non supervisé attribue de manière itérative chaque point de données dans l'un des groupes K en fonction de la similitude des caractéristiques. Par exemple, la similitude peut être basée sur les caractéristiques spectrales et l'emplacement. Dans une classification non supervisée, l'algorithme k-means segmente d'abord l'image pour une analyse plus approfondie. Ensuite, chaque grappe se voit attribuer une classe de couverture terrestre. Cependant, le SIG peut utiliser le clustering de différentes manières uniques. Par exemple, les points de données peuvent représenter un crime et vous souhaiterez peut-être regrouper les points chauds et faibles du crime. Alternativement, vous pouvez souhaiter segmenter en fonction des caractéristiques socio-économiques, sanitaires ou environnementales (comme la pollution).