Использование SQL для извлечения информации из таблиц

В ЭТОЙ ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц. Вы узнаете как указывать только нужные столбцы или изменять их порядок и как автоматически устранять избыточность получаемых данных. В заключение, вы узнаете как устанавливать условие, с помощью которого можно указать какие строки таблицы нужно использовать. Эта последняя особенность, будет далее описана в более поздних главах и является одной из наиболее изящных и мощных в SQL.

СОЗДАНИЕ ЗАПРОСА

Как мы подчеркивали ранее, SQL - это Структурированный Язык Запросов. Запросы - вероятно наиболее часто используемый аспект SQL. Фактически, для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то другого. По этой причине, мы будем начинать наше обсуждение SQL с обсуждения запроса и как он выполняется на этом языке.

ЧТО ТАКОЕ ЗАПРОС ?

Запрос - команда, которую вы даете вашей СУБД и которая сообщает ей чтобы она вывела определенную информацию из таблиц в память. Эта информация обычно посылается непосредственно на экран компьютера или терминала которым вы пользуетесь, хотя, в большинстве случаев, ее можно также послать на принтер, сохранить в файле (как объект в памяти компьютера), или представить как вводную информацию для другой команды или процесса.

ГДЕ ПРИМЕНЯЮТСЯ ЗАПРОСЫ ?

Запросы обычно рассматриваются как часть языка DML. Однако, так как запрос не меняет информацию в таблицах, а просто показывает ее пользователю, мы будем рассматривать запросы как самостоятельную категорию среди команд DML, которые производят действие, а не просто показывают содержание базы данных.

Все запросы в SQL состоят из одиночной команды. Структура этой команды обманчиво проста, потому что по факту имеет множество расширений, необходимые для выполнения сложной обработки данных. Эта команда называется - SELECT (ВЫБОР).

КОМАНДА SELECT

В самой простой форме, команда SELECT просто инструктирует базу данных о том, что нужно извлечь информацию из таблицы. Например, вы могли бы вывести таблицу Продавцов напечатав следующее:

       SELECT snum, sname, sity, comm 
          FROM  Salespeople; 
 

Вывод для этого запроса показывается в Рисунке 3.1.

            ===============  SQL Execution Log ============ 
          |                                               | 
          | SELECT snum, sname, sity, comm                | 
          | FROM  Salespeople;                            | 
          |                                               | 
          | ==============================================| 
          |   snum      sname         city         comm   | 
          | ------    ----------   -----------   -------  | 
          |   1001      Peel         London        0.12   | 
          |   1002      Serres       San Jose      0.13   | 
          |   1004      Motika       London        0.11   | 
          |   1007      Rifkin       Barcelona     0.15   | 
          |   1003      Axelrod      New York      0.10   | 
           =============================================== 

Рисунок 3.1: команда SELECT

Другими словами, эта команда просто выводит все данные из таблицы. Большинство СУБД будут также показывать при выводе заголовки столбцов (как выше на рисунке), а некоторые позволяют детальное форматирование вывода, но это уже вне стандартной спецификации.

Вот детальные пояснения для каждой части этой команды:

  • SELECT - Ключевое слово которое сообщает базе данных что эта команда - запрос. Все запросы начинаются этим словом, сопровождаемым пробелом.
  • snum, sname. Это - список столбцов из таблицы, которые выбираются запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на информацию в таблицах; он только показывает данные.
  • FROM Salespeople. FROM - ключевое слово, подобно SELECT, которое должно быть представлено в каждом запросе. Оно сопровождается пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов (Salespeople).
  • ;. Точка с запятой используется во всех интерактивных командах SQL чтобы сообщать базе данных, что команда заполнена и готова выполниться. В некоторых системах наклонная черта влево (\) в строке, также является индикатором конца команды.

Естественно, запросу такого характера не обязательно упорядочивать вывод каким-либо особым способом. Та же сама команда выполненная с теми же самыми данными но в разное время может вывести строки в другом порядоке. Обычно, строки выдаются в том порядке, в котором они найдены в таблице, поскольку как мы установили в предыдущей главе - этот порядок произволен. Это не обязательно будет тот порядок в котором данные вводились или сохранялись. Вы можете упорядочивать вывод командами SQL непосредственно: с помощью специального предложения. Позже, мы покажем как это делается. А сейчас, просто усвойте, что в отсутствии явного упорядочения, при выводе никакого определенного порядка нет.

При вводе команды SQL, можно пользоваться переводом строки (обычно Enter). Каждый должен для себя решить, как ему удобнее вводить запрос: в несколько строк или в одну строку, следующим образом:

      SELECT snum, sname, city, comm FROM Salespeople; 

С тех пор как SQL использует точку с запятой чтобы указывать конец команды, большинство программ SQL обрабатывают перевод строки (через клавишу ENTER) как пробел. Использование переводов строк и выравнивание пробелами (что мы делали ранее) помогает сделать ваши команды более легкими для чтения и избежать ошибок.

ВЫБИРАЙТЕ ВСЕГДА САМЫЙ ПРОСТОЙ СПОСОБ

Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать. Звездочка (*) может применяться для вывода полного списка столбцов следующим образом:

      SELECT * 
      FROM Salespeople; 

Это приведет к тому же результату что и наша предыдущая команда.

ОПИСАНИЕ SELECT

В общем случае, команда SELECT начинается с ключевого слова SELECT, сопровождаемого пробелом. После этого должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы, вы можете заменить этот список звездочкой (*). Ключевое слово FROM следующее далее, сопровождается пробелом и именем таблицы запрос к которой делается. В заключение, точка с запятой ( ; ) должна использоваться чтобы закончить запрос и указать что команда готова к выполнению.

ПРОСМОТР ТОЛЬКО ОПРЕДЕЛЕННОГО СТОЛБЦА ТАБЛИЦЫ

Команда SELECT способна извлечь строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только определенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть, из части команды SELECT. Например, запрос

 
   SELECT sname, comm 
      FROM Salespeople; 
 

будет производить вывод показанный на Рисунке 3.2.

            ===============  SQL Execution Log ============ 
        |                                               | 
        | SELECT snum, comm                             | 
        | FROM  Salespeople;                            | 
        |                                               | 
        | ==============================================| 
        |        sname             comm                 | 
        |   -------------      ---------                | 
        |        Peel              0.12                 | 
        |        Serres            0.13                 | 
        |        Motika            0.11                 | 
        |        Rifkin            0.15                 | 
        |        Axelrod           0.10                 | 
         =============================================== 
 

Рисунок 3.2: Выбор определенных столбцов

Если у вас такие таблицы, которые содержат множество столбцов с данными, но не все из них являются относящимися к поставленной задаче, то вы можете указывать только полезные для Вас столбцы.

ПЕРЕУПОРЯДОЧЕНИЕ СТОЛБЦА

Даже если столбцы таблицы, по определению, упорядочены, это не означает что вы будете выводить их в том же порядке. Конечно, звездочка (*) покажет все столбцы в их естественном порядке, но если вы укажете столбцы отдельно, вы можете получить их в том порядке, в котором хотите. Давайте рассмотрим таблицу Порядков, содержащую дату приобретения (odate), номер продавца (snum), номер порядка (onum), и суммы приобретения (amt):

   SELECT odate, snum, onum, amt 
      FROM Orders; 
 

Вывод этого запроса показан на Рисунке 3.3.

      =============  SQL Execution Log  ============= 
    |                                                 | 
    |  SELECT odate, snum, onum, amt                  | 
    |  FROM Orders;                                   | 
    |                                                 | 
    | ------------------------------------------------| 
    |     odate        snum        onum          amt  | 
    | -----------   -------      ------     --------- | 
    | 10/03/1990       1007        3001         18.69 | 
    | 10/03/1990       1001        3003        767.19 | 
    | 10/03/1990       1004        3002       1900.10 | 
    | 10/03/1990       1002        3005       5160.45 | 
    | 10/03/1990       1007        3006       1098.16 | 
    | 10/04/1990       1003        3009       1713.23 | 
    | 10/04/1990       1002        3007         75.75 | 
    | 10/05/1990       1001        3008       4723.00 | 
    | 10/06/1990       1002        3010       1309.95 | 
    | 10/06/1990       1001        3011       9891.88 | 
    |                                                 | 
      =============================================== 

Рисунок 3.3: Реконструкция столбцов

Как вы можете видеть, структура информации в таблицах - это просто основа для активной перестройки структуры в SQL.

УДАЛЕНИЕ ИЗБЫТОЧНЫХ ДАННЫХ

DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом устранять двойные значения из вашего предложения SELECT. Предположим что вы хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определенный день определенным заказчиком у определенного продавца на определенную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввести:

     SELECT snum 
       FROM Orders; 
 

для получения вывода показанного в Рисунке 3.4

                    ===============  SQL Execution Log ============ 
              |                                               | 
              | SELECT snum                                   | 
              | FROM  Orders;                                 | 
              |                                               | 
              | ============================================= | 
              |   snum                                        | 
              | -------                                       | 
              |   1007                                        | 
              |   1001                                        | 
              |   1004                                        | 
              |   1002                                        | 
              |   1007                                        | 
              |   1003                                        | 
              |   1002                                        | 
              |   1001                                        | 
              |   1002                                        | 
              |   1001                                        | 
                ============================================= 
 

Рисунок 3. 4: SELECT с дублированием номеров продавцов.

Для получения списка без дубликатов, для удобочитаемости, вы можете ввести следующее:

       SELECT DISTINCT snum 
          FROM Orders; 
 

Вывод для этого запроса показан в Рисунке 3.5.

Другими словами, DISTINCT следит за тем, какие значения были ранее, так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предположить что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете получить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT.

ПАРАМЕТРЫ DISTINCT

DISTINCT может указываться только один раз в данном предложении SELECT. Если предложение выбирает многочисленные пол,

                  ===============  SQL Execution Log ============ 
              |                                               | 
              | SELECT DISTINCT snum                          | 
              | FROM  Orders;                                 | 
              |                                               | 
              | ============================================= | 
              |   snum                                        | 
              | -------                                       | 
              |   1001                                        | 
              |   1002                                        | 
              |   1003                                        | 
              |   1004                                        | 
              |   1007                                        | 
                ============================================= 
 

Рисунок 3.5: SELECT без дублирования

DISTINCT опускает строки где все выбранные пол идентичны. Строки в которых некоторые значения одинаковы а некоторые различны - будут сохранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей ( за исключением когда он используется внутри агрегатных функций, как описано в Главе 6 ), так что нет никакого смысла чтобы его повторять.

DISTINCT ВМЕСТО ALL

Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противоположный эффект, дублирование строк вывода сохранится. Так как это - тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL - по существу скорее пояснительный, а не действующий аргумент.

КВАЛИФИЦИРОВАННЫЙ ВЫБОР ПРИ ИСПОЛЬЗОВАНИИ ПРЕДЛОЖЕНИЙ

Таблицы имеют тенденцию становиться очень большими, поскольку с течением времени, в них добавляется все большее и большее строк. Поскольку обычно бывают нужны только определенные строки, SQL дает возможность устанавливать критерии, определяющие какие строки будут выбраны для вывода.

WHERE - предложение команды SELECT, которое позволяет вам устанавливать предикаты, условие которых может быть или верным или неверным для любой строки таблицы. Команда извлекает только те строки из таблицы, для которых указанное условие верно. Например, предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду:

      SELECT sname, city 
        FROM Salespeople; 
        WHERE city = "LONDON"; 

Когда в запросе есть предложение WHERE, СУБД просматривает всю таблицу по одной строке (это упрощенное понимание, не учитывающее индексы -- прим.кор.) и исследует каждую строку чтобы определить верно ли заданное условие. Следовательно, для записи Peel, программа рассмотрит текущее значение столбца city, определит что оно равно "London", и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Рисунке 3.6.

                ===============  SQL Execution Log ============ 
              |                                               | 
              | SELECT sname, city                            | 
              | FROM  Salespeople                             | 
              | WHERE city = 'London'                         | 
              | ============================================= | 
              |   sname           city                        | 
              |  -------       ----------                     | 
              |   Peel            London                      | 
              |   Motika          London                      | 
                ============================================= 
 

Рисунок 3.6: SELECT c предложением WHERE

Давайте попробуем пример с числовым полем в предложении WHERE. Поле rating таблицы Заказчиков предназначено, чтобы разделять заказчиков на группы основанные на некоторых критериях, которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на сумме предыдущих приобретений. Такие числовые коды могут быть полезны в реляционных базах данных как способ подведения итогов сложной информации. Мы можем выбрать всех заказчиков с рейтингом 100, следующим образом:

     SELECT * 
        FROM Customers 
        WHERE rating = 100; 

Одиночные кавычки здесь не используются потому, что оценка - это числовое поле. Результаты запроса показаны в Рисунке 3. 7.

Предложение WHERE совместимо с предыдущим материалом в этой главе. Другими словами, вы можете использовать номера столбцов, устранять дубликаты, или переупорядочивать столбцы в команде SELECT которая использует WHERE. Однако, вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE.

                ============  SQL Execution Log ============ 
              |                                               | 
              | SELECT *                                      | 
              | FROM  Customers                               | 
              | WHERE rating = 100;                           | 
              | ============================================= | 
              |   сnum     cname    city     rating    snum   | 
              |  ------   --------  ------    ----   ------   | 
              |   2001     Hoffman  London     100     1001   | 
              |   2006     Clemens  London     100     1001   | 
              |   2007     Pereira  Rome       100     1001   | 
                ============================================= 
 

Рисунок 3.7: SELECT с числовым полем в предикате

РЕЗЮМЕ

Теперь вы знаете несколько способов получения нужной информации из таблицы, а не просто вывод всех ее данных. Вы можете переупорядочивать столбцы таблицы или устранять любой из них. Вы можете решать, хотите вы видеть дублированные значения или нет.

Наиболее важно то, что вы можете устанавливать условие называемое предикатом которое определяет вывод только нужных строк в таблицы из тысяч других строк.

Предикаты могут содержать очень сложные условия, предоставляя вам высокую гибкость для выборки нужных строк с помощью запроса. Именно эта способность решать точно, что вы хотите видеть, делает запросы SQL такими мощными. Следующие несколько глав будут посвящены, в большей мере, особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены другие операторы, отличные от тех, которые используются в условиях предиката, а также способы объединения нескольких условий в единый предикат.

РАБОТА С SQL

  1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и дату для всех строк из таблицы Порядков.
  2. Напишите запрос который вывел бы все строки из таблицы Заказчиков для которых номер продавца = 1001.
  3. Напишите запрос который вывел бы таблицу со столбцами в следующем порядке: city, sname, snum, comm.
  4. Напишите команду SELECT которая вывела бы оценку(rating), сопровождаемую именем каждого заказчика в San Jose.
  5. Напишите запрос который вывел бы значения snum всех продавцов в текущем порядке из таблицы Порядков без каких бы то ни было повторений.

(См. Приложение A для ответов.)

Back to top

(С) Виктор Вислобоков, 2008-2023