Consulta un conjunto de datos p�blicos con la herramienta de bq

Aprende a examinar y consultar un conjunto de datos p�blicos con la herramienta de l�nea de comandos de bq.


Para seguir la gu�a paso a paso en esta tarea directamente en la consola de Google Cloud, haz clic en Gu�a:

GUIARME


Antes de comenzar

  1. Accede a tu cuenta de Google�Cloud. Si eres nuevo en Google�Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos tambi�n obtienen�$300 en cr�ditos gratuitos para ejecutar, probar y, adem�s, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. Aseg�rate de que la facturaci�n est� habilitada para tu proyecto de Google Cloud.

  5. Si no habilitas la facturaci�n para el proyecto de Google Cloud que uses en este instructivo, deber�s subir datos en la zona de pruebas de BigQuery y trabajar con ellos. La zona de pruebas de BigQuery te permite comprender la plataforma con un conjunto limitado de funciones de BigQuery sin cargo.

  6. Aseg�rate de que la API de BigQuery est� habilitada.

    Habilitaci�n de la API

    Si creaste un proyecto nuevo, la API de BigQuery se habilita de forma autom�tica.

  7. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

Examina un conjunto de datos p�blicos

BigQuery ofrece varias tablas de muestra en el conjunto de datos bigquery-public-data.samples que puedes consultar. En este instructivo, ejecutar�s consultas en la tabla shakespeare, que contiene una entrada por cada palabra que aparece en cada obra de Shakespeare.

Examina la tabla shakespeare en el conjunto de datos samples:

bq show bigquery-public-data:samples.shakespeare

El resultado es similar al siguiente. Algunas columnas se omiten para simplificar el resultado.

  Last modified                  Schema                 Total Rows   Total Bytes
----------------- ------------------------------------ ------------ ------------
 14 Mar 17:16:45   |- word: string (required)           164656       6432064
                   |- word_count: integer (required)
                   |- corpus: string (required)
                   |- corpus_date: integer (required)

Consulta un conjunto de datos p�blicos

Usa el comando bq query para ejecutar consultas en SQL sobre los datos.

  1. Determina cu�ntas veces aparece la substring raisin en las obras de Shakespeare:

    bq query --use_legacy_sql=false \
        'SELECT
          word,
          SUM(word_count) AS count
        FROM
          `bigquery-public-data.samples.shakespeare`
        WHERE
          word LIKE "%raisin%"
        GROUP BY
          word;'
    

    El resultado es similar a este:

    +---------------+-------+
    |     word      | count |
    +---------------+-------+
    | praising      |     8 |
    | Praising      |     4 |
    | raising       |     5 |
    | dispraising   |     2 |
    | dispraisingly |     1 |
    | raisins       |     1 |
    +---------------+-------+
    
  2. Busca la substring huzzah en las obras de Shakespeare:

    bq query --use_legacy_sql=false \
        'SELECT
          word
        FROM
          `bigquery-public-data.samples.shakespeare`
        WHERE
          word = "huzzah";'
    

    Como la substring no aparece en las obras de Shakespeare, no se muestran resultados.

Realiza una limpieza

Para evitar que se apliquen cargos a tu cuenta de Google�Cloud por los recursos que se usaron en esta p�gina, borra el proyecto de Cloud que tiene los recursos.

Borra el proyecto

Si usaste la zona de pruebas de BigQuery a fin de consultar el conjunto de datos p�blicos, la facturaci�n no estar� habilitada para tu proyecto.

La manera m�s f�cil de eliminar la facturaci�n es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la p�gina Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  3. En el di�logo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

�Qu� sigue?