internetWiadomość główna

TED: Pierwsza rozproszona geograficznie baza danych

Wyobraź sobie bazę danych znajdującą się na kilku serwerach stojących powiedzmy w Londynie, Warszawie, Moskwie, Tokio i San Francisco. Nie synchronizowane bazy danych znajdujące się na różnych serwerach, nie kopie tej samej bazy – jedną relacyjną bazę danych znajdującą się fizycznie w wielu miejscach.

Właściwie nie trzeba sobie tego wyobrażać ponieważ wczoraj TransLattice pokazało bazę danych TED, czyli „TransLattice Elastic Database”.

„Przez ostatnie 15 lat próbowano rozwiązać problem rozproszonych baz danych”, mówi wiceprezes TransLattice Louise Funke. „Nasze rozwiązanie jest wyjątkowe(…) to naprawdę baza danych, której dane znajdują się w różnych lokalizacjach.”

Celem przyświecającym założonej w 2007 roku firmie, było stworzenie bazy danych, która mogłaby być dostępna cały czas, niezależnie od tego w jakim stanie znajdują się jej fragmenty. Bazy danych, która nie miałaby centralnego serwera i mogłaby sama odbudowywać stracone fragmenty danych. Taka hydra, której niestraszne są trzęsienia ziemi, powodzie oraz awarie elektrowni prądu. Ale jak to ma działać w praktyce?

Dane są dzielone w zależności od trzech czynników. Pierwszym jest polityka danej instytucji, która może sobie nie życzyć tego, by pewne dane znalazły się w węźle znajdującym się w konkretnym kraju. Drugim czynnikiem jest historia dostępu do danych – zostaną one przerzucone tam gdzie najczęściej się z nich korzysta. Trzecim czynnikiem jest losowość – dane nigdy nie będą znajdowały się tylko na jednym węźle. Dane znajdują się więc zawsze na kilku węzłach, ale nigdy nie na wszystkich. Aktualnie baza danych TED może składać się z 12 węzłów, ale TransLattice pracuje nad tym, by w przyszłości zwiększyć ich liczbę.

Największym problemem, przed którym stanęli inżynierowie kalifornijskiej firmy, było opracowanie algorytmów, które zapewniłyby dostęp do danych z każdego węzła, nie zajmując jednocześnie całej przepływności łącz tylko i wyłącznie na zapewnienie komunikacji i przesyłanie danych pomiędzy węzłami. Wewnętrzna komunikacja pomiędzy węzłami bazy danych nie mogła zabić funkcjonalności.

„Nasz system jest wyjątkowy — monitorujemy komunikację pomiędzy węzłami by mieć dane na temat łącz i ich wykorzystania, więc kiedy system decyduje o przeniesieniu danych, przenoszone są one tam, gdzie się z nich korzysta. Potrafimy rozmieścić je tak, by osiągnąć maksymalną efektywność,” mówi Funke.

Firma zapewnia, że nowy węzeł można uruchomić w ciągu 20 minut a, po podpięciu do sieci, pozostałe węzły rozpoznają do i w ciągu kilku następnych minut, TED zacznie zapełniać go danymi.

Pierwsi użytkownicy już dziś korzystają z baz danych TED. Użytkownicy z rodzaju tych, o których publicznie mało się mówi. Funke zdradza tylko, że mają „wielu klientów z sektora publicznego, związanych z obroną i wywiadem.” Ale nie tylko wywiad byłby zainteresowany tego typu bazami danych. Duże instytucje finansowe czy międzynarodowe korporacje również mogą skorzystać z tego rozwiązania. Wygląda więc na to, że trzy lata pisania algorytmów zwrócą się TransLattice z nawiązką.

[Venturebeat]


podobne treści