Введние в реляционную базу данных

SQL ( ОБЫЧНО ПРОИЗНОСИМАЯ КАК "СЭКВЭЛ" ) символизирует собой Структурированный Язык Запросов. Это - язык который дает вам возможность создавать и работать в реляционных базах данных, которые являются наборами связанной информации сохраняемой в таблицах.

Мир баз данных становится все более и более единым, что привело к необходимости создания стандартного языка, который мог бы использоваться для функционирования в большом количестве различных видов компьютерных сред. Стандартный язык позволит пользователям, знающим один набор команд, использовать их, чтобы создавать, отыскивать, изменять, и передавать информацию, независимо от того, работают ли они на персональном компьютере, сетевой рабочей станции, или на универсальной ЭВМ.

В нашем все более и более взаимосвязанном компьютерном мире, пользователь снабженный таким языком, имеет огромное преимущество в использовании и обобщении информации из ряда источников с помощью большого количества способов.

Элегантность и независимость от специфики компьютерных технологий, а также его поддержка лидерами промышленности в области технологии реляционных баз данных, сделало SQL, и вероятно в течение обозримого будущего оставит его, основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL.

Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (Международной организацией по стандартизации). Однако, большинство коммерческих программ баз данных расширяют SQL без уведомления ANSI, добавляя разные другие особенности в этот язык, которые, как они считают, будут весьма полезны.

Иногда они несколько нарушают стандарт языка, хотя хорошие идеи имеют тенденцию развиваться и вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств.

В этой книге, мы будем, в основном, следовать стандарту ANSI, но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандарта.

Вы должны проконсультироваться с документацией вашей SQL СУБД, которую вы будете использовать, чтобы знать где в есть отличия от стандарта.

ПРЕЖДЕ, ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных.

В этой главе, мы это объясним, и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь, и если вы уже знаете эти понятия довольно хорошо, вы можете просто пропустить эту главу.

Но в любом случае, вы должны ознакомится с тремя таблицами, которые предоставляются и описываются в конце главы; они станут основой наших примеров в этой книге. Вторая копия этих таблиц находится в Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним.

ЧТО ТАКОЕ - РЕЛЯЦИОННАЯ БАЗА ДАННЫХ?


Реляционная база данных - это тело связанной информации, сохраняемой в двухмерных таблицах. Напоминает адресную или телефонную книгу. (Или таблицу MS Exсel -- прим. кор.)

В адресной книге имеется большое количество записей персон, каждая из которых состоит из нескольких независимых фрагментов данных, например: имя, телефонный номер, и адрес. Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами. Каждая строка (также называемая записью) будет соответствовать определенному человеку; каждый столбец (также называемый колонкой) будет содержать значение для каждого из вышеперечисленных фрагментов данных - имени, телефонного номера, и адреса, которые представлены в каждой строке. Таким образом, адресная книга могла бы выглядеть следующим образом:

ИмяТелефонАдрес
Gerry Farish(415)365-8775127 Primrose Ave.,SF
Celia Brock(707)874-3553246 #3rd St.,Sonoma
Yves Grillet(762)976-3665778 Modernas,Barcelona

То, что вы получили, является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двухмерной (строка и столбец) таблицей информации.

Однако, реляционные базы данных редко состоят из одной таблицы. Создав несколько таблиц взаимосвязанной информации, вы сможете выполнить более сложные и мощные операции с вашими данными. Мощность базы данных зависит от связи, которую вы можете создать между фрагментами информации, а не от самого фрагмента информации.

СВЯЗЫВАНИЕ ОДНОЙ ТАБЛИЦЫ С ДРУГОЙ


Позвольте нам использовать пример нашей адресной книги чтобы начать обсуждение базы данных которая может реально использоваться в деловой ситуации. Предположим, что персоны в нашей первой таблице (адресной книги) - это пациенты больницы. В другой таблице, мы могли бы запомнить дополнительную информацию об этих пациентах. Столбцы второй таблицы могли бы быть помечены как Пациент, Доктор, Страховка, и Баланс.

ПациентДокторСтраховкаБаланс
FarishDrumeB.C./B.S.$272.99
GrilletHalbenNone$44. 76
BrockHalbenHealth,Inc.$9077.47

Для этих двух таблиц можно выполнить множество операций, извлекающих информацию из этих таблиц, если задавать для этих операций параметры, которые включают в себя фрагменты информации связанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов. Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациентов (по адресной книге) с таблицей, которая бы указывала, какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове и сразу получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными. Программы реляционной базы данных разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа, что очевидно является более универсальным методом в деловом мире. Даже если бы база данных больницы содержала сотни или тысячи имен - как это вероятно и бывает на практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти мгновенно.

ПОРЯДОК СТРОК ПРОИЗВОЛЕН


Чтобы поддерживать максимальную гибкость, строки таблицы, по определению, не должны находиться ни в каком определенном порядке. С этой точки зрения, в этом структура базы данных отличается от нашей адресной книги.

Вход в адресную книгу обычно упорядочивается в алфавитном порядке. В системах с реляционной базой данных, имеется одна мощна возможность для пользователей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее.

Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информацию упорядоченной в алфавитном порядке по именам, иногда в возрастающем или убывающем порядке, а иногда сгруппированной по отношению к какому-нибудь доктору. Наложение порядка набора в строках будет сталкиваться со способностью заказчика изменять его, поэтому строки всегда рассматриваются как неупорядоченные. По этой причине, вы не можете просто сказать: "Мы хотим посмотреть пятую строку таблицы". Пренебрегая порядком, в котором данные вводились или любым другим критерием, мы определим, не ту строку, хотя она и будет пятой. Строки таблицы которые рассматриваются, не находятся в какой-либо определенной последовательности.

ИДЕНТИФИКАЦИЯ СТРОК ( ПЕРВИЧНЫЕ КЛЮЧИ )


По этим и другим причинам, вы должны иметь столбец в вашей таблице который бы уникально идентифицировал каждую строку. Обычно, этот столбец содержит номер - например, номер пациента назначаемый каждому пациенту. Конечно, вы могли бы использовать им пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, у вас не будет другого способа чтобы отличить этих пациентов друг от друга.

Вот почему номера так необходимы. Такой уникальный столбец (или уникальная группа столбцов ), используемый, чтобы идентифицировать каждую строку и хранить все строки отдельно, называется - первичный ключ (primary key на английском -- прим. кор.) таблицы.

Первичные ключи таблицы важный элемент в структуре базы данных. Они - основа вашей системы записи в файл; и когда вы хотите найти определенную строку в таблице, вы ссылаетесь к этому первичному ключу. Кроме того, первичные ключи гарантируют, что ваши данные имеют определенную целостность. Если первичный ключ правильно используется и поддерживается, вы будете знать, что в таблице нет пустых строк и что каждая строка отличается от любой другой строки. Мы будем обсуждать ключи и далее, когда поговорим относительно ссылочной целостности в Главе 19.

СТОЛБЦЫ ИМЕНУЮТСЯ И НУМЕРУЮТСЯ


В отличие от строк, столбцы таблицы (также называемые полями или колонками) упорядочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно указать на "адрес столбца" или на "столбец 3". Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное имя, чтобы избежать неоднозначности. Лучше всего если эти имена указывают на содержание поля. В типовых таблицах этой книги, мы будем использовать такие сокращения для имени столбца, как cname для имени заказчика, и odate для даты порядка. Мы также дадим каждой таблице персональный числовой номер столбца в качестве первичного ключа. В следующем разделе про эти таблицы и их ключи будет рассказываться более подробно.

ТИПОВАЯ БАЗА ДАННЫХ


Таблицы 1.1, 1.2, и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать, и достаточно полной, чтобы иллюстрировать главные понятия и практику использования SQL. Эти таблицы напечатаны в этой главе а также в Приложении E.

Поскольку они будут использоваться для иллюстрирования различных особенностей SQL по всей этой книге, мы рекомендуем чтобы вы скопировали их, для удобства.

Вы могли уже обратить внимание что первый столбец каждой таблицы содержит номера, значения которых различны для каждой строки. Как вы наверное и предположили, это - первичные ключи таблиц. Некоторые из этих номеров также показаны в столбцах других таблиц. В этом нет ничего неверного. Они показывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение используется в самом первичном ключе.

Таблица 1.1: Продавцы

SNUMSNAMECITYCOMM
1001PeelLondon.12
1002SerresSan Jose.13
1004MotikaLondon.11
1007RifkinBarcelona.15
1003AxelrodNew York.10

Таблица 1.2: Заказчики

CNUMCNAMECITYRATINGSNUM
2001HoffmanLondon1001001
2002GiovanniRome2001003
2003LiuSanJose2001002
2004GrassBerlin3001002
2006ClemensLondon1001001
2008CisnerosSanJose3001007
2007PereiraRome1001004

Таблица 1.3: Порядки

ONUMAMTODATECNUMSNUM
300118.6910/03/199020081007
3003767.1910/03/199020011001
30021900.1010/03/199020071004
30055160.4510/03/199020031002
30061098.1610/03/199020081007
30091713.2310/04/199020021003
300775.7510/04/199020041002
30084723.0010/05/199020061001
30101309.9510/06/199020041002
30119891.8810/06/199020061001

Например, поле snum в таблице Заказчиков указывает, какому продавцу назначен данный заказчик. Номер поле snum связано с таблицей Продавцов, которая дает информацию об этих продавцах. Очевидно, что продавец, которому назначены заказчики, должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть представлено в таблице Продавцов. Если это так, то говорят, что "система находится в состоянии ссылочной целостности". Этот вывод будет более полно и формально объяснен в Главе 19.

ПРИМЕЧАНИЕ: Эти три представленных таблицы в тексте имеют русские имена - Продавцов, Заказчиков и Порядков, и далее будут упоминаться именно под этими именами. Имена любых других применяемых в книге таблиц будут написаны по-английски что бы отличать их от наших базовых таблиц этой базы данных. Кроме того в целях однозначности, имена заказчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни.

Таблицы приведены как пример к похожей ситуации в реальной жизни, когда вы будете использовать SQL, чтобы следить за продавцами, их заказчиками, и рейтингом заказчиков. Давайте рассмотрим эти три таблицы и значения их полей. Здесь показаны столбцы Таблицы 1.1:

ПОЛЕСОДЕРЖАНИЕ
snumуникальный номер назначенный каждому продавцу ("номер служащего" ).
snameимя продавца.
cityрасположение продавца( город ).
commкомиссионные продавцов в десятичной форме.

Таблица 1.2 содержит следующие столбцы:

ПОЛЕСОДЕРЖАНИЕ
cnumуникальный номер назначенный каждому заказчику.
cnameим заказчика.
cityрасположение заказчика( город ).
ratingкод указывающего уровень предпочтения данного заказчика перед другими. Более высокий номер указывают на большее предпочтение( рейтинг ).
snumномер продавца назначенного этому заказчику (из таблицы Продавцов)

Таблице 1.3 содержит следующие столбцы:

ПОЛЕСОДЕРЖАНИЕ
onumуникальный номер данный каждому приобретению.
amtзначение суммы приобретений.
odateдата приобретения.
cnumномер заказчика делающего приобретение ( из таблицы Заказчиков ).
snumномер продавца продающего приобретение ( из таблицы Продавцов).

РЕЗЮМЕ


Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фундаментальные принципы относительно того, как сделаны таблицы - как работают строки и столбцы, как первичные ключи отличают строки друга друга, и как столбцы могут ссылаться к значениям в других столбцах.

Вы поняли что запись это синоним строки, и что поле это синоним столбца (и колонки -- прим. кор.). Оба термина встречаются в обсуждении SQL, и мы будем использовать их в равной степени в этой книге.

Вы теперь знакомы с таблицами примеров. Краткие и простые , они способны показать большинство особенностей языка SQL, как вы это увидите. В некоторых случаях, мы будем использовать другие таблицы или постулаты некоторых различных данных в одной из этих таблиц чтобы показать вам некоторые другие возможности.

Теперь вы готовы к углублению в SQL самостоятельно. Следующая глава даст вам быстрый просмотр языка, и даст вам информацию, которая поможет Вам ссылаться к уже пройденным местам.

РАБОТА С SQL


  1. Какое поле таблицы Заказчиков является первичным ключом?
  2. Что является столбцом 4 из таблицы Заказчиков?
  3. Как по другому называется строка? Столбец?
  4. Почему вы может не запрашивать для просмотра первые пять строк таблицы?

(См. Приложение A для ответов. )

Back to top

(С) Виктор Вислобоков, 2008-2023