-
Notifications
You must be signed in to change notification settings - Fork 0
/
links_totales.py
35 lines (27 loc) · 1.15 KB
/
links_totales.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
from bs4 import BeautifulSoup
import requests
# URL de la página web
url = 'https://elpais.com/internacional/elecciones/europeas/19/01/41/'
# Realizar la solicitud GET a la página web
response = requests.get(url)
# Verificar si la solicitud fue exitosa
if response.status_code == 200:
# Crear un objeto BeautifulSoup para analizar el HTML
soup = BeautifulSoup(response.text, 'html.parser')
# Encontrar todas las etiquetas option
options = soup.find_all('option')
# Nombre del archivo de texto
nombre_archivo = 'hrefs_municipios.txt'
# Abrir el archivo en modo de anexión
with open(nombre_archivo, 'w') as archivo:
# Iterar sobre todas las etiquetas option
for option in options:
# Obtener el valor del atributo href
href = option.get('value')
# Verificar si href no es None antes de concatenarlo
if href is not None:
# Escribir el valor del atributo href en el archivo
archivo.write(href + '\n')
print("Los hrefs han sido guardados en el archivo:", nombre_archivo)
else:
print("Error al obtener la página:", response.status_code)