RASPAGEM de DADOS com PYTHON usando BeautifulSoup | Python na Prática #9
Ainda precisa aprender a programar? Aprenda Python do Jeito Certo e desenvolva uma base fundamental para se tornar capaz de pensar e criar soluções para problemas escrevendo código: https://youtu.be/5SChA-f9BdQ Como extrair dados de uma página HTML usando Python? Como transformar dados não estruturados em dados estruturados em um CSV? Aprenda com a Kizzy a minerar dados na internet para projetos de análise e visualização! Links: 📌Código implementado no vídeo: https://colab.research.google.com/github/programacaodinamica/mini-projetos/blob/master/src/Raspagem_de_dados_com_Beautiful_Soup.ipynb 📌https://www.estadao.com.br/infograficos/politica,placar-votos-eleicao-presidente-camara-deputados-2021,1145650 📌https://public.flourish.studio/visualisation/5154778/ No Python na Prática de hoje, Kizzy mostra como podemos realizar raspagem de dados na internet usando Python. O objetivo é ler e filtrar dados não estruturados de uma página HTML, construir um DataFrame em código e exportar uma base de dados estruturados em CSV. Para isso, Kizzy apresenta uma série de conhecimentos que podem ser úteis em várias situações, tais como realizar requisições com o módulo *requests*, inspecionar o código de uma página HTML usando o navegador de internet, analisar o conteúdo da página com o módulo Beautifulsoup, filtrar dados com expressões regulares, além de construir dataframes com Pandas e exportá-los como CSV. Construa você também sua própria base de dados estruturados para projetos de análise e visualização de dados! Este projeto nasceu da curiosidade de se compreender a votação para presidência da Câmara dos Deputados Federais e com os dados estruturados neste vídeo, poderemos realizar incríveis visualizações de dados no próximo vídeo utilizando a ferramenta Flourish, que já foi apresentada pela Kizzy no vídeo abaixo: 🔴A continuação deste projeto está no vídeo: GRÁFICOS HIERÁRQUICOS com Ferramenta de VISUALIZAÇÃO de DADOS online e muito FÁCIL de usar!: https://youtu.be/sD6vq7-ZSMA Assista também: 1. Consumindo dados da API do YOUTUBE com Python | Python na Prática #11 - https://youtu.be/olDCJ1w3FLM 2. Baixando DADOS oficiais de COVID-19 com SELENIUM em Python no Google Colab | Web Scraping https://youtu.be/eHZ_d0bINkM 3. RASPAGEM de TEXTOS dos Pronunciamentos do Presidente | Python na Prática #14 https://youtu.be/UlBlbDXh9mc 4. Temos VAGAS! Como passar nos PROCESSOS SELETIVOS? - https://youtu.be/-2WOid89ss8 5. RASPAGEM DE DADOS com Python É ILEGAL? Como saber se é permitido extrair dados de um site https://youtu.be/6t2vucUl7uY 6. RASPAGEM de DADOS dos JOGOS OLÍMPICOS de TÓQUIO com PYTHON - https://youtu.be/D13sHx-7n0U 📚 Livros recomendados de Data Science: https://amzn.to/2XZyxUr 📚 Livros de Algoritmos e Estruturas de Dados: https://amzn.to/3d5wK4m SetUp - Equipamentos: https://amzn.to/37Cg3N2 🟣 Canal na Twitch para lives: https://www.twitch.tv/pgdinamica 🟦 Canal do Telegram para receber os vídeos: https://t.me/joinchat/AAAAAFaoNgZTMRvrghpPPA 0:00 Por que fazer extração de dados? 1:50 Requisição da página HTML pelo pacote Requests do Python 2:23 Lendo o código HTML pela função "inspecionar" do navegador 3:10 Lendo e filtrando informações com o pacote BeautifulSoup (CORTE?) 7:56 Usando Expressão Regular (RegEx) com o módulo re (COrte aos 10?) 11:40 Construindo um Dataframe do Pandas com os dados obtidos 13:40 Exportando dados estruturados como CSV ✉️ E-mails: – Propostas comerciais: [email protected] – Demais assuntos: [email protected] 👩🏾💻👨🏾💻 Confira mais conteúdo em nosso blog: https://blog.programacaodinamica.com.br 📸 Nos siga no Instagram: https://instagram.com/pgdinamica 📸 @kizzy_terra @hallpaz 🐦 Nos siga no Twitter: https://twitter.com/pgdinamica 🐦 @kizzy_terra @hallpaz * Curta a Programação Dinâmica no facebook: fb.com/pgdinamica * Nosso repositório no Github: github.com/programacaodinamica * Confira o nosso Medium: medium.com/programacaodinamica * Confira os artigos no Python Café: pythoncafe.com.br 🥰 Se você gosta do nosso trabalho e acha relevante a nossa atuação no Youtube, considere nos apoiar se tornando membro do canal: https://www.youtube.com/programacaodinamica/join
Download
1 formatsVideo Formats
Right-click 'Download' and select 'Save Link As' if the file opens in a new tab.