Diferència entre revisions de la pàgina «Q. INE Municipis»

De wikijoan
Salta a la navegació Salta a la cerca
(Es crea la pàgina amb «=Introducció= Ens agrada treballar amb dades reals i bases de dades amb milers de registres. Concretament, a l'estat espanyol hi ha més de 8000 municipis. Farem ser...».)
 
Línia 28: Línia 28:
  
 
Com pots comprovar, aquest Excel té molta redundància de dades.
 
Com pots comprovar, aquest Excel té molta redundància de dades.
 +
 
2.
 
2.
  
Línia 47: Línia 48:
 
</pre>
 
</pre>
  
4. Exporta aquest Excel a un fitxer de text amb format CSV: municipis1.txt. Quants Kb ocupa aquest fitxer?
+
5. Exporta aquest Excel a un fitxer de text amb format CSV: municipis1.txt. Quants Kb ocupa aquest fitxer?
  
5. Exporta aquest Excel a un fitxer de text amb format CSV: municipis2.txt, però sense exportar els camps comunitat i província. Quants Kb ocupa aquest fitxer?
+
6. Exporta aquest Excel a un fitxer de text amb format CSV: municipis2.txt, però sense exportar els camps comunitat i província. Quants Kb ocupa aquest fitxer?
  
 
De moment tota la informació la tenim en un sol Excel. Però quan tinguem les taules, hi haurà tres taules, i no hi haurà cap redundància d'informació.
 
De moment tota la informació la tenim en un sol Excel. Però quan tinguem les taules, hi haurà tres taules, i no hi haurà cap redundància d'informació.

Revisió del 15:20, 13 oct 2021

Introducció

Ens agrada treballar amb dades reals i bases de dades amb milers de registres. Concretament, a l'estat espanyol hi ha més de 8000 municipis.

Farem servir les dades del INE (Instituto Nacional de Estadística):

La Generalitat també té un institu d'estadística propi, d'on es pot treure molta informació oficial:

Desenvolupament

Feina que fem a classe:

Cerquem a Google: 'INE municipios' i obtenim un enllaç amb un Excel descarregable d'on podem trobar tots els municipis (i també hi ha els codis de províncies i municipis).

Cerquem a Google: 'INE provincias' i obtenim un enllaç d'on podem trobar totes les províncies.

Cercar a Google: 'INE comunidades autónomas' i obtenim un enllaç d'on podem trobar totes les comunitats autònomes.

Entrega

Classroom. Entregaràs un document (Google docs, pdf) on realitzaràs les següents tasques (captures de pantalla allà on creguis necessari). La verbositat és important.

1. Posar en un sol Excel la següent informació (i amb aquest ordre):

cod_com, comunitat, id_prov, província, id_mun, municipi

Com pots comprovar, aquest Excel té molta redundància de dades.

2.

a) Quantes vegades apareix la paraula Andalucía?

b) Quantes vegades apareix la paraula Tarragona?

c) Quantes vegades apareix la paraula Mieres?

d) El nom de la població seria una bona clau primària?

3. Què passa amb Ceuta i Melilla? Quina problemàtica presenten?

4. Crea encara una nova columna, una columna que es digui municipi_net. Objectiu:

Harana/Valle de Arana -> Harana (i tots els casos similars)
Gineta, La -> La Gineta (i tots els casos similars)
Alqueria d'Asnar, l' -> l'Alqueria d'Asnar (i tots els casos similars)

5. Exporta aquest Excel a un fitxer de text amb format CSV: municipis1.txt. Quants Kb ocupa aquest fitxer?

6. Exporta aquest Excel a un fitxer de text amb format CSV: municipis2.txt, però sense exportar els camps comunitat i província. Quants Kb ocupa aquest fitxer?

De moment tota la informació la tenim en un sol Excel. Però quan tinguem les taules, hi haurà tres taules, i no hi haurà cap redundància d'informació.

NOTA. Farem servir tota aquesta informació més endavant per generar la nostra base de dades de municipis (versió 2021). En aquesta base de dades hi ha pocs canvis, però cada any hi ha algun canvi.


creat per Joan Quintana Compte, octubre 2021