Analyser JSON en Python - 3 étapes simples

Guides, Comment faire, Python, Aug-26-20225 minutes de lecture

L'analyse des données JSON à l'aide de Python facilite la transformation des données grâce à leur légèreté. International Data Corporation prévoit que, d'ici 2022, l'industrie du Big Data et des affaires augmentera de 62 % par rapport à 2018. Le partage des données étant une pratique courante dans le monde numérique, les gens ont l'intention d'envoyer des tonnes de données de leurs serveurs principaux à des serveurs de l'entreprise.

L'analyse des données JSON à l'aide de Python facilite la transformation des données grâce à leur légèreté. International Data Corporation prévoit que, d'ici 2022, l'industrie des Big Data et des entreprises augmentera de 62 % par rapport à 2018. Le partage des données étant une pratique courante dans le monde numérique, les gens ont l'intention d'envoyer des charges de données de leurs serveurs principaux vers des applications clientes ou d'un serveur vers d'autres bases de données. Les gens s'appuient fortement sur des formats de fichiers d'échange de données tels que JSON pour transmettre les données à l'appareil situé à l'autre extrémité qui convertit les données dans un format lisible par l'utilisateur. Dans cet article, nous allons voir ce qu'est JSON, comment analyser JSON en Python et pourquoi ?

Table des matières

Pourquoi analyser JSON en Python ?

JSON étant un format léger, il facilite la transformation en termes de temps et de rapidité. C'est pourquoi les spécialistes des données préfèrent envoyer et recevoir des messages au format JSON. Cependant, lorsque les données transformées nécessitent d'autres opérations, les utilisateurs doivent les convertir dans un langage compréhensible par les machines. C'est pourquoi les utilisateurs analysent JSON en Python. Ici, nous travaillons avec le langage Python. Nous devrons donc lire et analyser le JSON en utilisant les bibliothèques et les fonctions Python pour accéder aux données.

Pour connaître l'importance de l'analyse des données, lisez l'article Analyse des données et avantages.

Qu'est-ce que JSON ?

Javascript Object Notation (JSON) est un format de données léger qui transmet des informations d'un serveur à une application web dans un format lisible par l'utilisateur. Bien que le format JSON soit un dérivé de JavaScript, il utilise le format texte pour représenter les objets. Les machines peuvent analyser JSON en Python pour convertir les données JSON dans un format lisible par la machine.

Exemple de données JSON

{
   "person": [
 
      {
         "name": "John",
         "age": "26",
         "languages": ["C", “Python”]
      },
 
      {
         “name": “Nitin",
         "age": "24",
         "languages": ["Java", “Python”]
      }
   ]
}

Voici l'exemple de chaîne JSON. Le contenu entre les crochets est un objet, et les données entre les crochets sont des tableaux. 

Comment analyser JSON en Python

The JSON string {“name”: “John”, “age”: “26”, “languages”: [“C”, “Python”]} is similar to the dictionaries in Python. Just like dictionaries, JSON also has keys and values. Here the keys and value pairs are separated with a colon. The ‘name,’ ‘age,’ and ‘languages’ are the keys, and the data after the colon are the values of the respective keys. JSON can be accessed in Python using the JSON library that holds all the functions to convert the JSON strings into Python dictionaries and vice versa. 

Python peut accéder aux données JSON en important la bibliothèque JSON dans le code Python. Le module JSON de Python permet à l'utilisateur de lire, d'écrire, d'analyser et d'effectuer d'autres opérations sur les données JSON.

 import json

Analyser des données JSON en objets Python

Les données JSON sont de différents types : chaînes de caractères, tableaux, objets, nombres, fichiers, etc. 

Python Parse JSON - Objet Python équivalent

Après avoir reçu les données JSON, la tâche principale consiste à les convertir en types de données Python. Ce tableau présente la liste des types de données JSON et leurs formats Python équivalents.

Types de données JSONTypes de données Python
objetdictée
réseauliste, tuple
chaîne de caractèresstr
nombreint, float
vraiVrai
fauxFaux
aucunNul

Steps to Parse different JSON Data into Python

Nous allons ici apprendre à analyser certaines données JSON dans leur format Python équivalent. 

Chaînes JSON en dictionnaires PythonTableau JSON en listes PythonFichier JSON en objets Python. 

Analyser JSON en Python - Convertir des chaînes de caractères en dictionnaires

Prenons un exemple de chaîne JSON.

{
  "name": "John", 
  "age": "26"
 }

L'affectation de la chaîne de caractères à une variable peut faciliter les opérations d'analyse en passant la variable dans les fonctions. Exemple : print(personne)

person ='{"name": "John", "age": "26"}'

L'instruction print(person) permet d'imprimer la chaîne de caractères. 

person ='{"name": "John", "age": "26"}'
print(person)

Sortie 

{“name”: “John”, “age”: “26”}

En passant la variable dans la fonction type(), on s'assure que les données sont des chaînes de caractères.

person ='{"name": "John", "age": "26"}'
 print(person)
 print(type(person))

Sortie 

{“name”: “John”, “age”: “26”}

<class ‘str’>

Conversion de chaînes de caractères en dictionnaires

L'étape initiale consiste à analyser les données JSON qui sont sous forme de chaîne, dans une forme adaptée à Python. Comme nous l'avons vu précédemment, les chaînes JSON et les dictionnaires Python sont assez similaires, car ils sont tous deux structurés par paires clé-valeur. Pour lire et analyser les données JSON en Python, commençons par importer la bibliothèque JSON. La fonction loads() est utilisée pour analyser les chaînes JSON dans un dictionnaire Python. Le 's' dans la fonction loads() indique la chaîne de caractères.

import json
 json.loads(STRNAME)

Prenons l'exemple de la chaîne JSON que nous avons imprimée dans l'exemple ci-dessus. 

person ='{"name": "John", "age": "26"}'
 print(person)

Utilisation de la fonction json.loads() pour convertir la chaîne en dictionnaire python. Le "json" dans la fonction json.loads() indique le nom de la bibliothèque. 

json.loads(person)

Il est également nécessaire d'affecter l'instruction load() à une nouvelle variable. Ici, nous avons utilisé la variable "person_dxnry". 

person_dxnry = json.loads(person)pyt

Après avoir converti la chaîne en dictionnaire et l'avoir assignée à une nouvelle variable, nous pouvons utiliser la fonction type() pour voir le type des données avant et après la conversion.

print(type(personne))
print(type(personne_dxnry))
import json
 person ='{"name": "John", "age": "26"}'
 print(person)
 print(type(person))
 person_dxnry = json.loads(person)
 print(person_dxnry)
 print(type(person_dxnry))

Sortie :

{“name”: “John”, “age”: “26”}

<class ‘str’>

{‘name’: ‘John’, ‘age’: ’26’}

<class ‘dict’>

Ici, les fonctions type() montrent que le type est une chaîne de caractères dans le cas initial et qu'il devient un dictionnaire après conversion. 

Analyser JSON en Python - Convertir un tableau en liste

Essayons de convertir un autre type de données JSON en une structure Python, en utilisant cet exemple de code JSON qui contient un tableau.

{
         "name": "John",
         "age": "26",
         "languages": ["C", “Python”]
      }

Nous pouvons assigner le tableau à une variable "languages" pour le passer dans la fonction loads(). Nous pouvons ensuite créer une nouvelle variable "language_list" pour y affecter le résultat de la fonction loads().

languages = '["C", "Python"]
 languages_list = json.loads(languages)
import jsonpyt
 languages = ["C", "Python"]'
 languages_list = json.loads(languages)
 print(languages_list)
 print(type(languages_list))

L'utilisation des fonctions type() pour les deux variables peut nous aider à vérifier les types de données.

Sortie

['C', 'Python']

<class ‘list’>

Cette sortie indique que le tableau JSON dans "languages" est converti en liste par la fonction loads().

Analyser JSON en Python - Fichiers vers objets

Le format JSON le plus courant est une chaîne de caractères. Il y a également de fortes chances de recevoir des données au format JSON sous la forme d'un fichier. Quel que soit le type de données, le but ultime est de les analyser dans un format lisible par Python. Il existe deux fonctions, comme load() et loads(), que vous pouvez utiliser pour l'analyse. Ces fonctions d'analyse JSON diffèrent par le type de données JSON. Nous aborderons brièvement ces fonctions dans les sections suivantes.

La bibliothèque JSON intégrée à Python fournit une autre fonction de conversion "load()" pour lire et analyser le fichier JSON en Python. 

Comment lire et analyser un fichier JSON ?

Python Parse JSON - Trois méthodes.

La première étape consiste à enregistrer cet exemple de code sous le nom "person.json

{
         "name": "John",
         "age": "26",
      }

Il existe deux fonctions pour analyser un fichier JSON. La première est la fonction open(). La méthode open() permet d'ouvrir le fichier JSON et d'indiquer au compilateur d'effectuer le processus de conversion à l'aide de l'opération load(). 

with open('person.json') as file:pyt

Après avoir ouvert le fichier JSON, nous devons créer une variable "data" pour y affecter les opérations de chargement.

data = json.load(file)

Enfin, nous pouvons utiliser la fonction type() pour vérifier le type du contenu.

print(type(data))

Nous pouvons accéder aux éléments du dictionnaire converti en utilisant la variable "data" et en transmettant les clés du dictionnaire telles que "name" et "age".

print(data['age'])
 print(données['nom'])
import json
with open('person.json') as file :
data = json.load(file)
print(type(data))
print(data['age'])
print(data['name'])

Sortie :

<class ‘dict’>

26

Jean

La sortie indique que le type est "dictionnaire". Cela signifie que nous avons réussi à convertir le fichier JSON en une liste.

Écrire Python en JSON

Les fonctions dumps() et dump() permettent également de convertir les données Python en JSON. Il s'agit des processus inverses des fonctions load() et loads(). Prenons un dictionnaire Python et convertissons-le en chaîne JSON à l'aide de la fonction dump(). 

 Nous avons défini un dictionnaire Python sous le nom de "person_dictionary". 

person_dictionary = {'name': 'John', 'age': 26 }

Utilisez la fonction dumps() pour effectuer l'opération de conversion et l'affecter à une nouvelle variable "person_json".

person_json = json.dumps(person_dictionary)
 print(personne_json)
import json
person_dictionary = {'name': 'John',
 'age': 26
 }
 person_json = json.dumps(person_dictionary)
 print(person_dictionary)
 print(type(person_dictionary))
 print(person_json)
 print(type(person_json))

Sortie :

{‘name’: ‘John’, ‘age’: 26}

<class ‘dict’>

{“name”: “John”, “age”: 26}

<class ‘str’>

L'utilisation de la fonction type() pour les deux variables "person_dictioanry" et "person_json" garantit la conversion du format Python en chaîne JSON.

Comment proxys peut-il vous aider ?

L'analyse JSON est largement préférée dans les applications de transformation de données telles que le scraping, l'analyse, les migrations de données et les processus d'intégration de données. Ces solutions avec proxys vous aideront à avoir une meilleure expérience du scraping illimité et de la transformation de données en utilisant Python. Consultez ce blog pour savoir comment ajouter proxys aux requêtes python. Proxyscrape fournit des proxy de différents types pour faciliter le processus d'analyse.

Lire aussi

Comprendre l'école proxys

Comment configurer cURL proxys

Chaînage de proxys

FAQs :

1. Pourquoi analyser JSON en Python ?
L'analyse JSON est également possible avec d'autres langages, l'analyse Python étant assez populaire car elle fournit un package JSON intégré permettant de lire, de convertir et d'écrire facilement des données JSON. Cette analyse est utile dans des applications telles que le webcraping, le news scraping, le data wrangling, le data mining, le search engine scraping, et les industries du marketing où la transformation des données est nécessaire.
2. Citez quelques langages qui supportent JSON ?
Le format JSON est compatible avec C++, Java, PHP, C# et Python.
3. Que sont les objets JSON ?
Les objets JSON sont des collections de paires de noms et de valeurs entre accolades. Chaque paire nom/valeur est séparée par une virgule, tandis que le nom est suivi de deux points.

Résumé

JSON est devenu un élément essentiel des sites web. Chaque fois qu'il est nécessaire de transférer ou de partager des données, les gens utilisent souvent le format JSON, car il est léger et facilement interchangeable. Le format JSON ressemble davantage à une forme de texte, de sorte que les utilisateurs peuvent comprendre le contenu facilement. La machine peut également lire et analyser le contenu dans un format adapté à la machine. Nous avons abordé ici quelques fonctionnalités de conversion en Python, telles que open(), load(), loads(), dump() et dumps(). Ces fonctions intégrées au module JSON peuvent lire et analyser les données du format JSON vers les types de données Python, et vice versa.