Bien, dejémonos de historias. Que tengo para vosotros hoy? Pues os quiero presentar la página de GeoNames. Es una pagina web donde recopila información sobre: nombres de ciudades, de lagos, de pueblos, montañas, sobre municipios/provincias. Y contiene información, muuucha información. Entre otras la coordenadas del lugar que se busca, altitud, la población, el país, nombres similares que recibe este mismo sitio, wiki, etc...
Todos los datos del mundo en cleartext pesa unos 800MB aproximadamente. Bien. Pero me direis "si, ya, esto ya existe. Se llama Google Maps". Y lo cierto es que se parece, pero no es exactamente lo mismo. Las bases de datos de GeoNames se pueden descargar libremente. Es tan fácil como entrar en la página, ir a "Download server" y elegir el país que te quieres descargar.
Mas exactamente la información información que guardan es la siguiente:
The main 'geoname' table has the following fields :Bueno, en el siguiente post os muestro como volcar todos estos datos en una BBDD como MongoDB.
---------------------------------------------------
geonameid : integer id of record in geonames database
name : name of geographical point (utf8) varchar(200)
asciiname : name of geographical point in plain ascii characters, varchar(200)
alternatenames : alternatenames, comma separated varchar(5000)
latitude : latitude in decimal degrees (wgs84)
longitude : longitude in decimal degrees (wgs84)
feature class : see http://www.geonames.org/export/codes.html, char(1)
feature code : see http://www.geonames.org/export/codes.html, varchar(10)
country code : ISO-3166 2-letter country code, 2 characters
cc2 : alternate country codes, comma separated, ISO-3166 2-letter country code, 60 characters
admin1 code : fipscode (subject to change to iso code), see exceptions below, see file admin1Codes.txt for display names of this code; varchar(20)
admin2 code : code for the second administrative division, a county in the US, see file admin2Codes.txt; varchar(80)
admin3 code : code for third level administrative division, varchar(20)
admin4 code : code for fourth level administrative division, varchar(20)
population : bigint (4 byte int)
elevation : in meters, integer
gtopo30 : average elevation of 30'x30' (ca 900mx900m) area in meters, integer
timezone : the timezone id (see file timeZone.txt)
modification date : date of last modification in yyyy-MM-dd format
Saludos!
No hay comentarios:
Publicar un comentario