Back to Browse

Python Web-scraping: Usando Selenium para recolectar textos y analizarlo con NLTK (principiantes)

9.2K views
Sep 20, 2021
1:49:45

Generamos un proyecto real para extraer datos de necesidad de entidades de gobierno y mediante su texto comprender el tipo de adquisiciones que realizan bajo modalidad de ínfima cuantía (portal sercop Ecuador). Usando Python y Selenium generamos un bot que nos permite extraer los datos y usando NLTK hacemos un análisis exploratorio inicial de esos textos. Repositorio GitHub: https://github.com/bluesfer2007/selenium_extrac_analysisText Notion Con Links que necesitamos: https://foil-skate-4fb.notion.site/Selenium-con-Python-d96fa628656a4aec83054926a4629731 Mi Linkedin https://www.linkedin.com/in/fernando-j-pullutasig-acosta-b7463086/ Contenido del video: 0:00 Por qué usar Selenium 3:05 Página a Scrapear 7:47 Iniciar configuración con Selenium 11:54 Árbol Proyecto con VSCODE 16:31 Iniciar con Super Clase 22:54 Ejecutar main primer test 24:42 Método get obtener URL 31:41 Lógica avanzar paginas 37:15 Iniciar métodos extraer datos 45:24 Crear clase Reporte 54:42 Método Pull extraer texto 59:10 Método guardar en disco 1:06:04 Test extraer y guarda 1:12:36 Iniciar instalando NLTK 1:14:58 Notebook trabajo 1:17:16 Unificar archivos descargados 1:22:11 Iniciar tratamiento de texto 1:23:58 Tokenizar texto con REGEX 1:28:13 Estadística básica de texto 1:31:05 Limpiar StopWords 1:36:20 Gráfico Freq palabras 1:38:05 Generar Bigrams Ngrams 1:43:06 Gráfico Nube de Palabras 1:48:10 No Olvides compartir suscríbete

Download

0 formats

No download links available.

Python Web-scraping: Usando Selenium para recolectar textos y analizarlo con NLTK (principiantes) | NatokHD