DBRaptor

В мире информационных технологий, интегрированных в настоящее время практически во все виды человеческой деятельности, главным предметом являются данные. Успех любого бизнеса, как домашнего, так и управления многонациональной корпорацией, зависит от систематизации, целостности и качества обрабатываемой информации, анализа исходных данных, принятия решений и планирования на будущее. Во всех упомянутых стадиях ключевым моментом выступает правильная организация процесса сбора, хранения и обработки собранной информации. Для этих целей уже давно используются различные базы данных, создаваемые на платформах типа SQL SERVER, ORACLE, MySQL и многих других, менее известных и популярных.

В крупном бизнесе обычно много средств и возможностей для содержания высококвалифицированных консультантов от ведущих производителей программного обеспечения в сфере разработки и поддержки баз данных. Однако часто случается, что желанная цель создать хорошо организованную базу знаний становится недостижимой в силу почти неразрешимых проблем в процессе интеграции и консолидации неструктурированных данных. Обычные инструменты импорта, встроенные в движки баз данных, не способны осуществлять сложные операции по извлечению и переносу информации из подобных источников.

Любые исторические данные являются бесценным кладом для маркетинга, содержат богатейшую аналитическую информацию и статистику. Не секрет, что многие фирмы и компании накапливали и продолжают собирать заявления и анкеты клиентов, заполненные формы обратной связи с покупателями, различные производственные шаблоны, формы заказов, счетов-фактур, накладных и другие документы в виде Excel файлов, заполненных PDF форм, шаблонов Word и т.п.

С течением времени стандарты и требования меняются, соответственно меняются и подстраивать под них новые шаблоны заполнения электронных бланков. В итоге исторические данные обычно представляют собой причудливый калейдоскоп слабо- или вообще неструктурированной информации. Ниже будут представлены примеры сложных для обработки файлов.

Chemical analyses
Пример результатов химанализов из лабораторий

Многие фирмы благоразумно сохраняют свои исторические архивы на электронных носителях, оставляя на потом попытки использовать ее. Даже если у фирмы имеется много исторических данных в цифровом формате, для того чтобы сделать мало-мальски грамотный маркетинговый отчет, например, по анализу производительности той или иной модели товара, приходится перелопачивать сотни файлов в поисках закономерностей и трендов.

Pump test report
Карточка заполнения итогов теста производительности насоса

Сотни файлов – это уже десятки минут затраченных просто на открывание и закрывание файлов, а ведь надо еще и осуществлять поиск и анализ данных. В итоге для интеграции информации требуются месяцы кропотливого рутинного труда аналитика: поиск файла в ворохе каталогов, открытие файла, поиск данных, копирование и вставка ключевой информации в сводный отчет.

Pump evaluation report
Карточка заполнения итогов оценки состояния насоса

Хорошо - быть аналитиком, сидя за монитором хорошо налаженного DataWarehouse или квалифицированно созданной и заполненной данными АСУП (автоматизированной системы управления предприятием), и заниматься непосредственными обязанностями. Плохо - превратиться из аналитика с красным дипломом в канцелярскую крысу, если нет под рукой никакой, даже примитивной базы данных в Access, а есть унылое пространство файл-сервера компании.

Обычно средней сложности проект по интеграции информации, разбросанной по файл-серверам компании, занимает от одного месяца и более. Приблизительная сумма затрат складывается из количества и квалификации участников, сложности строения, содержания и формата входящих данных. Значительное количество драгоценного времени даже у опытного консультанта уйдет на тонкую и детальную настройку скриптов чтения импортируемых файлов. Не меньше времени уйдет на перехват встречающихся ошибок и обработку нестандартных ситуаций. Допустим, проект имеет бюджет из расчета 1 консультант с оплатой $1000/сутки, в помощь ему - собственный работник из расчета $160 в день, на проект - 1 месяц (22 рабочих дня). Итого: $22000 + $3520 = $25,520. Стоимость 352 человеко/часов = $73 за час. Необходимо обработать не менее 20,000 файлов.

На что способен DBRaptor? Скорость создания шаблона импорта в программе ~ 2-5 мин. Букально парой кликов Вы сможете определять поля для извлечения данных. Скорость пакетной обработки файлов - конвертация данных из множества файлов в реляционную структуру ~ 300-400 файлов в минуту. Итого, понадобится около 5 минут на настройку шаблона, плюс 60 минут на миграцию указанных 20,000 файлов. Учитывая непредвиденные сбои из-за содержания файлов, обработку других исключений - ~ 2 часа. Исходя из номинальной цены человеко/часа $73 согласно утвержденному бюджету клиента, получаем затраты $146 на черновую работу. Если включить необходимые операции по "гигиене" данных ( + 6 часов) - в совокупности выходит $580. Путем несложных расчетов сравнения производительности получается, что DBRaptor в 44 раза эффективнее традиционных ETL инструментов.

 

Наименование продукта

Сложность освоения и использования
Способность импортировать из неструктурированных файлов
Дополнительное внешнее ПО
Цена
MS SSIS Сложно Требуется специальное программирование Обязательно > $12,000
Informatica Power Center Очень сложно Требуется специальное программирование Обязательно > $100,000
acQuire Сложно Требуется специальное программирование Обязательно > $10,000
Century Systems Сложно Требуется специальное программирование Обязательно > $5,000
IBM, TIBCO, WebMethods Сложно Требуется специальное программирование Обязательно > $100,000
Adeptia SB Suite Средней сложности Неизвестно, скорее нет, чем да Обязательно > $20,000
Visual Importer ETL Professional Средней сложности Неизвестно, скорее нет, чем да Обязательно > $250
DBRaptor Легко Тексты любой сложности Не требуется ~ $???

 

DBRaptor был создан коллективом аналитиков для собственных нужд. Он получился легко усваиваемым как начинающими, так и опытными специалистами баз данных. Если Вы долго искали в просторах сети подходящий программный продукт для переноса данных из неструктурированных источников в реляционные базы, то, наверняка, сталкивались либо с непомерно завышенной ценой программ в сочетании со сложностью в эксплуатации, либо с примитивным функционалом и ограниченными возможностями, либо и тем и другим в совокупности. Если Вы читаете эти строки, то оказались на нужном веб-сайте в нужное время и нашли тот продукт, который приведет Вас к успеху.

DBRaptor's functionality
Предназначение пакета DBRaptor

Приобретите наш пакет DBRaptor для собственного успеха и избавьте себя от рутины по подготовке данных. Вы даже можете открыть свой самостоятельный бизнес по консультированию в сфере сбора, извлечения и миграции данных ETL (Extract-Load-Transform) и стать лучшим аналитиком в информационном бизнесе в своей области! Не верите?! Пришлите нам образцы проблемных данных, и мы покажем как Вы при помощи DBRaptor смогли бы решить свою проблему. После демонстрации возможностей нашей технологии многие вопросы отпадут сами собой, и только главный вопрос “Брать или не брать?” останется за Вами.

DBRaptor - Ваш пропуск в Высшую Лигу Информационных Технологий. Дальнейшее продвижение по ступенькам создания мощных реляционных баз данных и высокоинтеллектуальных DataWarehouse систем Вы сможете легко осуществить при помощи нашего продукта.

Если у Вас остались вопросы, заполните форму, и мы свяжемся с Вами в ближайшее время.

Или же Вы можете обратиться в
службу поддержки