Python >> Tutoriel Python >  >> Python

Installer une belle soupe

Résumé : Pour installer BeautifulSoup dans WIndows, utilisez la commande :pip install beautifulsoup4 . Pour l'installer sous Linux, utilisez la commande :sudo apt-get install python3-bs4 .

Objectif : Dans ce tutoriel, nous verrons comment installer BeautifulSoup ?

Puisque BeautifulSoup n'est pas une bibliothèque standard Python, nous devons l'installer avant de pouvoir l'utiliser pour gratter des sites Web. Par conséquent, nous examinerons les étapes d'installation du package BeautifulSoup 4 (également appelé bs4) et discuterons également de certains des problèmes qui surviennent après l'installation.

Remarque : La version actuelle est belle soupe 4.9.3 (3 octobre 2020).

❂ Installer BeautifulSoup sur une machine Linux

❖ Plate-forme :Debian ou Ubuntu

Si vous utilisez Python dans un système d'exploitation basé sur Debian ou Ubuntu, vous devez installer Beautiful Soup à l'aide du gestionnaire de packages système à l'aide de la commande suivante :

✻ PourPython 2.x

$sudo apt-get install python-bs4

✻ PourPython 3.x

$sudo apt-get install python3-bs4

Si vous ne souhaitez pas utiliser le gestionnaire de packages système, vous pouvez utiliser easy_install ou pip pour installer bs4.

✻ Commande pour installer bs4 en utilisant easy_install :

$easy_install beautifulsoup4

✻ Commande pour installer bs4 en utilisant pip :

$pip install beautifulsoup4

# Remarque : Si vous utilisez Python3, vous devrez peut-être installer easy_install3 ou pip3 respectivement avant de pouvoir les utiliser.

❖ Plate-forme :Windows

Installation de bs4 dans Windows est un processus en une étape et est très simple. Utilisez la commande suivante pour l'installer à l'aide de votre interface de ligne de commande.

pip install beautifulsoup4

❂ Quelques problèmes courants après l'installation

Vous pouvez rencontrer une erreur si une mauvaise version est installée. Voyons la raison derrière les erreurs !

Erreur :ImportError "Aucun module nommé HTMLParser"

Raison : L'erreur se produit car vous utilisez la version Python 2 du code dans Python 3.

Erreur :ImportError "Aucun module nommé html.parser"

Raison : L'erreur se produit car vous utilisez la version Python 3 du code dans Python 2.

Solution : Supprimez l'installation existante et réinstallez BeautifulSoup.

Erreur :SyntaxError "Syntaxe invalide" sur la ligne ROOT_TAG_NAME =u'[document]'

Solution : Convertissez la version Python 2 du code en Python 3 en :

  • Installer le paquet −
    • python3 setup.py install
  • Exécution manuelle du script de conversion Python 2 vers Python 3 (dans le directeur bs4) – 
    • 2to3-3.2 -w bs4

❂ Installer l'analyseur

Beautiful Soup prend en charge l'analyseur HTML par défaut qui est inclus dans la bibliothèque standard de Python. Cependant, il prend également en charge d'autres analyseurs Python externes ou tiers, comme indiqué dans le tableau ci-dessous :

Analyseur Utilisation typique Avantages Inconvénients
HTML.parser de Python BeautifulSoup(markup, "html.parser") Piles inclusesVitesse décenteFacile (à partir de Python 2.7.3 et 3.2.) Pas aussi rapide que lxml, moins indulgent que html5lib.
L'analyseur HTML de lxml BeautifulSoup(markup, "lxml") Très rapideIndulgent Dépendance C externe
L'analyseur XML de lxml BeautifulSoup(markup, "lxml-xml") BeautifulSoup(markup, "xml") Très rapideLe seul analyseur XML actuellement pris en charge Dépendance C externe
html5lib BeautifulSoup(markup, "html5lib") Extrêmement indulgentAnalyse les pages de la même manière qu'un navigateur WebCrée du code HTML5 valide Dépendance Python externe très lente

Utilisez les commandes suivantes pour installer le lxml ou le html5lib analyseur,

Linux :

$apt-get install python-lxml
$apt-get insall python-html5lib

Windows :

$pip install lxml
$pip install html5lib

Conclusion

Avec cela, nous arrivons à la fin de ce tutoriel clair sur la façon d'installer le BeautifulSoup bibliothèque. N'hésitez pas à suivre les étapes et à l'installer sur votre système. Si vous voulez apprendre à utiliser la bibliothèque BeautifulSoup et gratter une page Web, veuillez suivre ce TUTORIEL et consultez le guide étape par étape pour gratter votre page Web.

S'il vous plaît, abonnez-vous et restez à l'écoute pour des articles plus intéressants!


Post précédent