Смартсорсинг.ру

Сообщество руководителей ИТ-компаний, ИТ-подразделений и сервисных центров

Статьи в блогах Вопросы и ответы Темы в лентах Пользователи Компании Лента заказов Курс по ITSM

Александр Шуйсков (NAUMEN): перспективы развития Database as a Service

Выступление Александра Шуйскова (NAUMEN) на Неконференции *aaS предпринимателей 2011.

Перспективы развития Database as a Service
 
В настоящее время начинает развиваться рынок Database as a Service, то есть сервисов, предоставляющих реляционные и NoSQL облачные масштабируемые хранилища. На рынок выходят и крупнейшие международные компании, включая Microsoft, Google, о чем говорит появление таких сервисов, как SQL Azure, Google Storage. В докладе планируется рассказать о возможностях, преимуществах и недостатках существующих сервисов, а также о перспективах развития DaaS как на мировом, так и на внутреннем российском рынке.

Презентация

Видео

Стенограмма

Скачать .pdf

Database as a Service — это более лояльное представление базы данных, при котором она помещает, то есть, база данных представляется клиентом как сервис. То есть, грубо говоря, это нужно будет хостинг, в грубом представлении, это хостинг баз данных. В частном случае, это масштабируемый сервис баз данных, представляющий собой некую отказоустойчивость и набора иных услуг, то есть, какие основные особенности?

Данные хранятся на удаленных серверах, гарантируется multitenancy, то есть, изоляция от данных других клиентов, оплата идет по ряду квот, нет необходимости самим обслуживать свои собственные сервера с данными и, в частном случае, можно придерживаться масштабируемости на уровне хранения данных.

Хочу сразу заметить, что сегодня я буду говорить преимущественно применимо к сегменту среднего и малого бизнеса SMBE, о котором сегодня идет речь. То есть, нужно учитывать, что мы говорим о базе данных и о корпоративном приложении для агропрайс-клиентов, то мы имеем дело с несколько другими требованиями к отказоустойчивости и защищенности данных, порою, даже, к хранению, порой, юридические требования. Поэтому, сегодня мы этот случай рассматривать не будем, потому что, как мы знаем, основной потребитель aaS услуг, это сегмент малого и среднего бизнеса, поэтому будем говорить применительно к нему.

Какая ситуация складывается на текущий момент? Можно разделить пользователей баз данных на две группы. Первая группа — она использует базы данных, предоставляемые хостинговыми компаниями. Это, собственно, айтишные стартапы и категория сервисов, которые хранятся на хостингах. Это могут быть различные проекты на пэ-пэйджерах, стритджавы и так далее. Или это могут быть компании, которые используют собственные сервера для хранения баз данных. Сейчас мы расскажем подробнее об этих граппах и какие проблемы они в себе хранят.

Проблемы на текущий день баз данных, предоставляемых хостинговыми компаниями. Ну, это, в первую очередь, каждый хостинг имеет какие-то ограничения по набору хранимых баз данных. Порой, эти ограничения достигают 1-2 гигабайт, порой 10 гигабайт. Но, мы всегда знаем верхнюю границу, в которую мы упремся при использовании данной базы данных. Потом, это набор квот, которые не позволяют, не учитывают такие желания, как, например, почасовая оплата, использование, потом плата за репликацию и так далее. То есть, мы имеем дело с узким набором квот и обилие, в общем случае, становится не совсем удобным. Также, это, во многих случаях, отсутствие автоматического архивирования. И, один из главных недостатков, для обычных сервисов, это отсутствие масштабирования базы данных, то есть, когда мы упираемся в определенный верхний миг, то мы должны будем заказывать новые наборы услуг, переходить на новый тариф, и есть вероятность потери данных, отказа сервиса в случае того, когда мы достигаем наших квот.

Собственный сервер баз данных, это, в принципе, с точки зрения удобства для сминт эс-эм-би, это одна большая проблема. Почему? В первую очередь, для слежения собственных администраторов. Это серьезное неудобство, которое в себе хранит очень много проблем. Это высокая стоимость сопровождения. Фактически получается, что раньше проект стартап должен будет оплачивать услуги других людей, которые будут поддерживать определенные технические решения. На сегодняшний день существуют способы, как можно отказаться от данного, от подобных трат. Также человеческий фактор. Никто не гарантирует, что наши данные могут, не будут потеряны в случае ошибки системного администратора, которого взяли с небольшим опытом. В любом случае, человеческий приносит с собой элемент случайности. Также это повторно выполняемая работа, потому что для обеспечения отказоустойчивости и масштабируемости мы, в любом случае, должны будем использовать ряд действий, которые в том или ином виде были решены до нас. Как результат мы получаем, то, что мы выполняем повторную работу или «изобретаем велосипед» в случае с использованием баз данных.

Таким образом, такой подход является не самым удобным. Что требуется делать администраторам, которые сопровождают внутренние сервера баз данных? Требуется обеспечить отказоустойчивость на логическом уровне, то есть на уровне базы данных. Мы должны организовать репликацию. Мы должны настроить наши серверы баз данных для того, чтобы они обеспечивали гарантированное хранение на нескольких нодах. Мы должны обеспечить масштабируемость, то есть, когда у нас увеличиваются требования к объему хранения данных, сервера должны автоматически конфигурироваться под определенные требования. Должны обеспечить отказоустойчивость на физическом уровне, то есть электропитание, в случаях, например, отключится электричество, если у нас нарушится связанность топологии нашей сети, ну, также, это создание бэкапов и создание других опций, которые требуются клиентам. Из этого получается, что данный подход является достаточно дорогим и для сегмента SMB данный критерий является значительным, потому что исходя из этого составит средняя стоимость обеспечения услуг.

Ну, и в качестве того как может быть решена данная проблема: это может быть использование файлгиго-сервисов, то есть подход к базе данных как сервису приводит нас к трем бонусам, которые мы получаем. Это то, что наша база данных, которая будет храниться у сервис-провайдера, будет обеспечиваться некой командой людей, которые имеют в этом, некую долю, экспертную область. Мы абстрагируемся от различных проблем обеспечения отказоустойчивости и масштабируемости и главное преимущество, то что мы получаем, это то, что мы будем платить не за обслуживание базы данных, а за потребляемые ресурсы.

Таким образом, мы сможем лучше прогнозировать стоимость обслуживания, то есть стоимость, в которую нам встает использование данной базы. Таким образом, мы получаем гарантии поставщика услуг по тому, что поставщик обеспечивает нам определенную отказоустойчивость, оговоренную на юридическом уровне, получаем автоматическое создание резервных копий, набор других сервисов, которые мы хотим получить. Мы получаем отсутствие ежемесячной платы за сопровождение командой администраторов.

Таким образом, можно выделить целую группу поставщиков данного сервиса, которые представлены на данном слайде. То есть, это такие поставщики как Microsoft SQL Azure, который раньше входил в TL Azure, сейчас вышел отдельным сервисом, это FATHOM DB, это решение Амазона — Amazon Web Services, это сервис Database.com, это сервис-хост LongJump. Сейчас я подробнее расскажу о каждом из этих сервисов. Какие у него есть квоты, какие есть варианты биллинга и какие преимущества он дает как обычный сервер для хранения данных.

Начну с сервиса Microsoft SQL Azure. Он представляет два вида двигателей группы биллинг-опции. Это Web Edition и Business Edition. Соответственно, я должен выделить, что у нас имеется лимит по хранимым данным на текущий момент. Но, опять же, нужно заметить, что этот сервис сейчас запущен как beta, то есть в дальнейшем Microsoft планирует расширить квоты по хранимым данным, по объемам данных, и, соответственно, эти ограничения в 5 — 50 гигабайт для Web Edition и Business Edition они планируют расширить или лучше даже убрать такое. Ну, как мы видим, стоимость примерно десять долларов за гигабайт. Она остается постоянной. То есть мы не получаем никаких дополнительных преимуществ, если мы будем использовать больший объем. Но, тем не менее, как «плюс» можно заметить, что стоимость хранения данных не вырастает. То есть, мы можем прогнозировать, что если у нас возрастет объем хранимых данных, то у нас стоимость обслуживания будет возрастать. Ну, и…

Из зала: Ну, и маленькое дополнение. 50 гигабайтов только для традиционных баз данных.

Возможно.

Из зала: Если у нас идет хранилище трех блоков, то оно однократно. То есть четыре разных хранилища есть, то для одного ограничения 50 гигабайт.

Да, спасибо за уточнения. И, собственно, оно относилось к минусам, которые я здесь перечислил. Ну, 2 терабайта, это уже объем больше. Но, тем не менее, его можно все равно в минус, все равно то, что мы упираемся в какие-то верхние границы.

FATHOM DB. Здесь мы видим уже семь групп опций биллинга. Я не знаю, может на текущий момент уже расширилось. Информация, примерно, конца прошлого — начала этого месяца. То есть, мы видим вариант биллинга Pico. Это, соответственно от 10 и до 640 гигабайт. В общем случае, мы получаем более дешевой вариант, по сравнению с Microsoft, хранения данных. Опять же, в качестве минусов и плюсов можно указать больший объем — 640 гигабайт, в общем случае. Потом, вариант почасовой оплаты является преимуществом для некоторых клиентов. Ну, и меньшая стоимость, меньшая средняя стоимость, хранения гигабайтных данных. В качестве минуса — это сравнительно молодой проект с Калифорнии, если не ошибаюсь. То есть, они работают буквально несколько лет на рынке и, в целом, это может сказаться на отказоустойчивости. Хотя, проект развивается. Сейчас, насколько я вижу, они приостановили регистрацию, но, тем не менее, они принимают подписки и в скором времени они откроют новую подписку на свой сервис.

Ну, решение от Амазона. Во-первых, объем хранимых данных — от 5 гигабайт до 1 терабайта, на текущий момент. Следственно, годовая подписка от 227 до 5300 долларов. Ну, более подробно можно рассмотреть сайт этого предложения. Да, вот очень удобный выбор характеристик — это явный плюс. То есть, если зайти на сайт этого предложения, то можно увидеть, что существует буквально два листа защитных параметров конфигурации сервиса. Опять же, это накладывает определенную сложность на подбор конфигурации для нашей базы данных, потому что мы заранее можем не знать, какие характеристики нам могут быть удобны, но, тем не менее, мы в дальнейшем можем перейти на другую плату. Ну, и, соответственно, сложность прогнозирования расходов впоследствии, потому что, во-первых, существуют сейчас определенные лимиты, во-вторых, у нас существует огромное количество квот, по которым мы должны прогнозировать ежемесячные расходы с учетом роста.

Database.com. Это решение Giant Salesforce. По фиксированным объемам данных — они не говорят сколько это в байтах. Тем не менее, в бесплатный пакет, как я написал, входит 50 000 транзакций в месяц на трех пользователей. Ну, и дополнительная емкость оплачивается отдельно, то есть этот сервис обеспечивает полную масштабируемость, но при этом есть ряд неудобств. То есть, хоть и биллинг гибкий, прогнозировать не совсем удобно. Хотя, опять же, рост идет, рост стоимости потребления, уже линейный. Плату за транзакции можно назвать минусом, потому что в других приложениях это частично отсутствует. Ну, и ограничение количества пользователей, то есть за каждого дополнительного пользователя клиент должен платить отдельно, хотя это не может быть этично.

Можно описывать другие решения, но среди основных решений для хранения навигационных данных можно выделить эти пять, то есть другие решения — такие вопросы: там предоставляют меньше объема, то есть среди основных игроков на мировом рынке — это пять данных проектов.

Да, то есть, из сказанного, сложный биллинг во всех случаях. В некоторых случаях идет учет количества передаваемых данных, что делает использование, то есть прогнозирование потребления данных сервисов, практически невозможным с точки зрения с учетом на какой-то определенный временной период, на будущее. В большинстве присутствует ограничение лимита на объем хранимых данных. Исключение Database.com составляет. Средняя стоимость хранения данных сейчас выше, хотя, если требуется обеспечение отказоустойчивости на должном уровне и отсутствие сопровождения, то такие предложения действительно являются хорошим плюсом.

Хочу еще заметить, что явных игроков на российском рынке в данной среде не выявляется. То есть, вполне возможно существование таких сервисов, но они себя не позиционируют как полноценные Database as a Service. То есть, соответственно, эта область молодая, единично развивающаяся в России, и, вполне возможно, что эта область получит развитие также, как она получила развитие сейчас во всем мире. То есть, над ней работают такие как Microsoft, Salesforce, Amazon, достаточно активно. Поэтому, она уже вполне может рассматриваться как идея стартапов для предпринимателей, которые хотят использовать базы данных.

Ну, соответственно, плюсы, которые мы получаем, это указанная готовая инфраструктура данных сервисов, потому что мы не должны оплачивать услуги администрирования, мы получаем определенную отказоустойчивость. Как результат, мы не платим за обслуживание данных сервисов. Соответственно, мы получаем достаточно гибкую систему оплаты, которая рассчитана за объем потребляемых нами данных.

Перспектива развития, как я сказал, это развитие данного рынка в России, упрощение системы оплаты, потому что на данный момент система оплаты достаточно сложная и индивидуальная для каждого поставщика данных и выбрать оптимальный тарифный план еще очень сложно. Это с учетом того, что игроков на рынке еще очень мало, то можно рассматривать эти предложения индивидуально. Ну, и увеличение объемов хранимой информации. Поскольку, сейчас только Salesforce активно говорит о том, что у них данные масштабируются в определенных пределах до какого-то фактически неограниченного числа, то мы получаем некое неудобство в выборе. То есть, у нас фактически сейчас идет Salesforce как монополист на рынке DaaS с высокой степенью масштабируемости.

Ну, так сказать, спасибо. Сейчас можно почитать также DaaS Informac Serfing. Ну, сейчас можно поговорить еще.

Из зала: Скажите, пожалуйста, если у нас большая база данных на несколько терабайт, то, я так понял из вашего доклада, то есть, делать для таких больших баз данных… не имеет смысла использовать…?

На данный момент, да, и это будет стоить очень дорого. То есть, этот рынок еще развивается.

Из зала: То есть, экономически не целесообразно?

Экономически, да, это нецелесообразно.

Из зала: Лучше иметь свои сервера?

Для нескольких терабайт удельная стоимость хранения данных будет очень высокая на текущий момент. Поэтому, опять же, у этого рынка есть определенные перспективы развития. Ну, и было бы интересно увидеть российских игроков на этом рынке. Опять же, мы знаем российскую специфику, что мы не можем гарантировать полную защищенность наших данных, но, тем не менее, я думаю, такие варианты появятся. Плюс еще у нас ограничение выбора. Мы фактически можем выбирать всего из нескольких игроков, потому что у многих квоты гораздо меньше.

Из зала: Какие платформы на данный момент поддерживают этот момент, то есть Oracle, Salesforce, Microsoft? То есть им нужно приносить локальную базу данных? Поставщики предоставляют сразу все варианты?

Они предоставляют средства импорта в свою собственную инфраструктуру. Понятное дело, что они не будут давать полные возможности для управления данными, те же создания бэкапов и так далее. Это отдельная опция, которая стоит отдельных денег. Соответственно, они предоставляют только средства импорта. Ну, на текущий момент, конечно, средства импорта созданы с Microsoft Server и Oracle. Это все зависит уже от сервис-поставщика, от каждого индивидуально. Я не изучал, какие у них есть средства импорта для различных баз данных, поэтому не могу сказать их полный спектр.

Из зала: Проводили какие-нибудь подсчеты? Например, 50 гигабайт положить на эти обычные сервисы, сколько будет выходить по деньгам в месяц?

По деньгам в месяц 50 гигабайт база... Это нужно посмотреть. Если брать, например, такие варианты, в которых мы не ограничены в других квотах, то у того же SQL Azure будет где-то 500 долларов в месяц. Ну, как я понимаю, у них, во-первых, объем пользователей не ограничен. Вообще, стоимость доходит до 10 долларов за 1 гигабайт. Есть ниже гораздо, у того же FATHOM DB она значительно ниже. Сейчас, кстати, спектр цен немного изменился, потому что сейчас они переделывают варианты биллинга. Но, тем не менее, мы получаем здесь, у того же FATHOM DB, сумму гораздо меньшую.

Сейчас настолько разнятся подходы к биллингу, то есть у некоторых биллинги указаны в определенном размере, у них указаны за использование транзакций, за количество пользователей. Самый сложный биллинг, конечно, у Амазона, два листа, примерно, различных вариантов и приходится платить и за транзакции, и за пользователей, за объем передаваемых и полученных данных и так далее. Для некоторых сложно прогнозировать, на каких ресурсах им будет лучше. Это уже пользователь сам для себя решает. У некоторых клиентов может быть специфика, что они могут работать с такими сервисами не круглосуточно и соответственно платить только за время пользования.

Из зала: Оперативная память?

Оперативная память на сервере. То есть, соответственно, FATHOM DB на этот момент не совсем абстрагировал клиента от характеристик серверов, на которых хранятся данные. Сейчас, насколько я вижу, закрылись для данного подхода. У них сейчас небольшие изменения происходят. Если зайти к ним, то они вообще закрылись, только подписка идет.

Из зала: А вы лично какие из представленных базовых решений использовали?

Я не использовал этих решения, потому что этот рынок еще достаточно новый. Сейчас, у нас собственная компания Naumen, мы занимаемся сейчас в данный момент разработкой новой платформы и как раз оцениваем целесообразность реализации по опыту обычного хранилища. То есть, соответственно, мы еще только оцениваем рынок. Я не использовал эти приложения. Я только посмотрел предлагаемый биллинг.

Еще интересно было бы на практике услышать о задержке работы с этими сервисами. Понятно то, что она присутствует.

Из зала: А силуэт, кстати, есть?

Да.

Из зала: А сколько там девяток?

Это я не могу сказать вам, потому что они не предоставляют его в открытом виде, есть только страницы с описаниями их услуг.

Из зала: А у вас уже есть какая-то своя концепция такого сервиса?

Ну, сейчас интересна область scorel-хранилищ. Мне кажется, сейчас мы будем работать в данном направлении. Вообще, на мой взгляд, обслуживание распределенных облачных анимационных баз данных — это очень сложный процесс в техническом плане, поэтому, вполне возможно, что будут какие то научные новости в области данных хранилищ. В данный момент я пока не увидел крупных игроков на данном рынке. Тем не менее, сейчас Google предлагает свой Google Storage. Ну, это, конечно, не анимационная база данных. Вообще, это списки. Но, тем не менее, они уже начали работать в подобном направлении. Ну, конечно, там отдельный биллинг. Мне кажется, эту форму надо пробовать в стандартном хранении.

Из зала: Скажите, а совсем нет данных о производительности по скорости выполнения запросов по сравнению, хотя бы, с локальными хранилищами?

К сожалению, нету. У нас нет сейчас таких данных, потому что мы сами эти сервисы не использовали. К тому же, с учетом того, что SQL Azure может существовать отдельно от этих сервисов, не была еще просто времени эту систему проверить.

Комментарии (0)