Czym są dane?
Dane (z ang. data) są wszystkim tym, co może być przetwarzane umysłowo czy komputerowo. Przetwarzalność danych, czyli możliwość ich wykorzystywania, jest ich nadrzędną cechą. Najczęstszymi danymi są: otwarte dane, dane publiczne czy tzw. Big Data. Big Data określa duże, zmienne i różnorodne zbiory danych. Ich przetwarzanie i analiza jest trudna, ale wartościowa, gdyż prowadzi do zdobycia nowej wiedzy. Sprawdź poniżej, czym są bazy danych.
Czym są bazy danych?
Bazy danych są zatem zbiorem danych, które zostały zapisane w określonym, odpowiednim dla nich formacie. Format pozwala nam na dostęp do nich. Dane zapisywane są w różny sposób, w zależności od ich późniejszego wykorzystania. Ma to wpływ na wydajność operacji takich jak: zapis, odczyt, usuwanie, czy modyfikację danych.
Kategorie modeli danych.
Wśród modeli danych wyróżniamy dwie kategorie:
- Koncepcyjne modele danych – stosuje się je w pierwszych etapach projektów, do weryfikacji wyróżnionych obiektów i związków między nimi.
- Implementacyjne modele danych – stosuje się je do transformacji wcześniej przygotowanego modelu koncepcyjnego do konkretnego modelu bazy danych.
Baza danych– modele
Modele baz danych to techniki przechowywania danych. Opisują strukturę danych w bazie. Zanim zaczniemy przechowywać dane, musimy określić formę ich przechowywania.
Wśród modeli implementacyjnych wyróżniamy:
- Model hierarchiczny – dane organizowane są w postaci drzewa. Informacje zawarte są w dokumentach oraz w strukturze drzewa. Podobna organizacja jest w przypadku folderów na komputerze. Mamy jeden punkt początkowy i wiele rozgałęzień – tak jak w przypadku drzewa genealogicznego. Zbiór nadrzędny nazywany jest rodzicem, a podzbiory potomkami.
- Model sieciowy – dokumenty tworzą sieć, dzięki powiązaniom między nimi. Informacja zawarta jest w dokumentach oraz w przebiegu połączeń sieci. Dowolny zbiór danych możemy powiązać z każdym innym – co jest niemożliwe w przypadku modelu hierarchicznego.
- Model obiektowy – połączenie cech programów komputerowych, które tworzone są w językach programowania obiektowego z cechami aplikacji bazodanowych. Aplikacje bazodanowe w modelu obiektowym opierają się na obiektach.
- Model relacyjny – najpopularniejsza grupa baz danych. Model relacyjny wykorzystywany jest najczęściej przy projektowaniu baz danych. Dane przechowywane są w wielu tabelach, a pomiędzy tabelami tworzone są powiązania, czyli relacje.
Relacyjne bazy danych opierają się o kilka tablic danych, które są ze sobą powiązane polem o wspólnej nazwie. Dobrym przykładem jest zbiór kart katalogowych – np. karty książek w bibliotece. Taka baza danych nazywana jest kartotekową i opiera się o 1 plik danych.
W modelu relacyjnym dane wewnątrz bazy podzielone są między tabele – czyli układ poziomych wierszy zwanych rekordami i pionowych kolumn nazywanych polami rekordu. Tabele pozwalają na wprowadzanie danych i przechowywanie je w pamięci, sortowanie, filtrowanie itp. Każda informacja jest zapisywana w rekordzie, które dzielą się na pola. Pole ma swoją nazwę, wielkość oraz definicję typu danych (znakowe, numeryczne, datownikowe, logiczne itd.). Taki podział nazywamy normalizacją.
Systemy relacyjnych baz danych.
Systemy zarządzania bazami danych to aplikacje lub inaczej biblioteki, które zarządzają bazami danych. Te systemy zarządzania wymagają pewnej struktury, określające sposób reprezentacji i współpracy z danymi. Może to być na przykład tabela. W tabeli każda kolumna ma inny typ informacji, a każdy rekord w bazie posiada swój identyfikator. Wszystkie związane są pomiędzy sobą w modelu relacyjnym. Do najpopularniejszych relacyjnych systemów zarządzania bazami danych należy zaliczyć Oracle, MySQL, Microsoft SQL Server oraz PostgreSQL.
Bazy danych- korzyści z zastosowania
Największym plusem stosowania baz danych jest niewątpliwie zmniejszenie nadmiaru danych, które przechowujemy. Przechowywane dane możemy współdzielić, czyli pracować w wielu aplikacjach bez zagrożenia, że ulegną zniszczeniu. Mamy kontrolę nad autoryzacją dostępu do danych, uniemożliwiając użytkowanie poufnych danych osobom niepowołanym. Dzięki możliwości utworzenia wielu rodzajów interfejsów danych możemy wizualizować te same dane w różnych formatach, zmieniając perspektywę odbioru użytkownika.