Small data что это

Быстрые, малые, умные. Какие еще бывают большие данные?

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Термин Big Data или «большие данные» получил широкое распространение в середине 2000-х и приходится на развитие эпохи «свободного интернета» или технологии Web 2.0. В Web 2.0 ключевыми акторами являются сами пользователи и их личный опыт: смешная картинка, которой они решили поделиться; отзыв на недавно приобретенную покупку, совершенную онлайн; семейная фотография с поездки на море. К признакам «раннего» Web 2.0 можно отнести многочисленные веб-форумы, имиджборды, массовые онлайн чаты. Сегодня на смену веб-форумам пришли социальные сети и тематические блоги.

За развитием концепции Web 2.0 последовала другая — концепция Big data. Изначально этот термин использовался в контексте проблем обработки многочисленных неструктурированных данных. Сегодня же под «большими данными» все чаще подразумевают совокупность подходов к обработке постоянно накапливающейся информации и поиску в ней различных закономерностей.

Для более четкого определения обратимся к энциклопедии журнала PC Magazine:

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Большие — это сколько?

Слово «большие» не отражает размерность данных. Сказать, что 100 Гб текста, это «большие данные» — некорректно. Кроме того, классифицировать набор данных из 10 пользователей как «маленький» — также некорректно. Если необходимо подчеркнуть количество информации в одном наборе, то используют термин Lot of Data или «много данных».

Подход «большие данные» применяется там, где стандартные методы обработки информации являются неэффективными.

В качестве классического примера можно привести социальные сети: Instagram, Twitter, YouTube и др. Ежедневно миллионы пользователей, заходя в сеть, оставляют огромное количество цифровых следов: просмотры записей, переходы по ссылкам, лайки, репосты. При этом каждая операция содержит отметку о времени. В результате имеется постоянно обновляемый набор данных о пользовательских действиях, анализируя который, можно более эффективно настроить рекламу или, например, формировать персональную (другими словами — умную) ленту для пользователя.

Если есть большие, значит есть и маленькие?

Есть — маленькие, малые или, более привычно — Small Data. Единого определения для термина нет. Но в обиходе можно встретить несколько от части связанных между собой концепций. Вот некоторые из них:

В академической сфере для определения понятия «Small Data» используется первый вариант. Принято считать, что до 2008 года все научные данные, по сути, были тем, что сейчас называют как «малые». Требования для сбора и хранения больших массивов информации до 2010 года были выше имеющихся тогда технических возможностей.

Малые данные — это часть больших данных, их некоторая подвыборка с условием ограничения по времени и/или по количеству представленной информации.

С другой стороны, малые данные — это массив такой размерности, который в большей степени «подвластен» исследователям без использования высоких вычислительных мощностей. Кроме того, при работе с малыми данными предоставляется больше возможностей для их укомплектования на подготовительном этапе, так что информацию о каждом объекте можно расширить. По аналогии с социальными сетями из примера о больших данных, можно выделить пользовательские действия за ограниченный период, затем по каждому из них в личном порядке (например методом рассылки опроса) уточнить настроение человека, его чувства и эмоции во время работы с системой.

Стоит отметить, что малые данные не обязательно являются отсекаемой частью больших данных и могут быть сформированы без них.

С размером понятно. А что еще?

Кроме «размерных» определений выделяют и другие концепции представления данных, лежащих как в научной, так и в предпринимательской плоскости. Рассмотрим некоторые из них.

Smart data

Smart Data или «умные данные» — это модель данных, имеющая смысл и/или ценность. В отличие от больших и малых, умные данные представляются следующим этапом филигранной постобработки собранной информации.

Американский деловой журнал Inc. приводит определение понятие Smart Data:

Умные данные данные, которые имеют действительную, четко определенную, значимую информацию, которая может ускорить обработку информации и принятие решений.

Простыми словами, умные данные содержат в себе лишь полезную информацию, удобную не только для считывания машиной, но и для обработки человеком.

Продолжая пример с социальными сетями: умные данные — это четко структурированная информация о том, какие тематики записей (политика, экономика, спорт и т.д.) нравятся различным группам пользователей (детям, подросткам, девушкам, молодым людям и т.д.).

Fast data

Подход «быстрые данные» или Fast Data ставит своей задачей оперативное обнаружение релевантной информации в постоянно поступающем и возрастающем потоке Big Data. Быстрые данные являются звеном между этапами сбора и обработки информации и выявлению из нее полезных свойств за максимально короткий промежуток времени.

Таким образом, понятие «обеспечение Fast Data» — это выявление Smart Data в Big Data в режиме реального времени для дальнейшего анализа.

Data, Data, Data, DATAAA.

Первоочередной причиной для подготовки этого материала послужило довольно распространенное и, зачастую, неправильное использование понятия Big Data. Необходимо признать, что сегодня возможности для обработки больших данных обусловлены не только техническими ограничениями, но и потенциальным наличием этих данных. Использование подхода Big Data оправдано только тогда, когда имеется достаточное количества объектов и их признаков.

Кроме того, для работы в области больших данных необходим целый штат рабочих, включая аналитиков, разработчиков, администраторов баз данных, менеджеров всех уровней и др., что наводит на мысль о реальности применении этих методов только крупными игроками на рынке.

Научным исследователям стоит присмотреться к более мелким концепциям, вроде Small Data или Smart Data и, возможно, затронуть понятие Capta Data (Johanna Drucker), на котором я подробно остановлюсь в следующий раз.

Источник

Важные мелочи: роль Small Data в современном маркетинге

В эпоху цифровой трансформации глубокое понимание клиента — это основа коммуникаций бренда. Big Data дает возможность расширить представления об аудитории, ее неочевидных свойствах, привычках и интересах. Однако для создания по-настоящему актуального Customer Experience этих данных может быть недостаточно

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Еще недавно получение обратной связи от потребителей в большей степени было инструментом для анализа уже сделанных решений. Маркетологи обращались к таким данным, чтобы понять, как сработало рекламное сообщение, правильно ли люди воспринимают бренд по результатам кампании и т. д. Но популярность «экономики впечатлений» в совокупности с технологическим развитием и социально-культурными изменениями привели к тому, что перед бизнесом возникла новая задача — понимать своих клиентов настолько, чтобы в реальном времени выстраивать с ними персонализированную коммуникацию.

Термин «экономика впечатлений» появился далеко не вчера. Впервые его предложили использовать в 1998 году в статье Б. Джозефа Пайна II и Джеймса Х. Гилмора, где этот термин описывал тип экономики, который следует за аграрной, промышленной и экономикой услуг. Пайн и Гилмор утверждали, что компании должны стремиться к тому, чтобы их активности оставались в памяти потребителей. Более того, память сама по себе становится продуктом. Именно впечатления дают брендам конкурентное преимущество, помогают привлекать и удерживать аудиторию. Для брендов, которые соотносят собственную активность со стилем жизни своих потребителей, открываются огромные возможности. Проявляя внимание к клиентам, компании получают четко измеримую выгоду: лояльность аудитории и ее регулярное вовлечение. Все это возможно, если внимательно прислушиваться к своим потребителям.

Уже 20 лет назад «экономика впечатлений» считалась тем фундаментом, на котором необходимо выстраивать всю работу с клиентами. Конечно, тогда никто не представлял, как сильно на привычки пользователей повлияет интернет.

Бренды не сидят сложа руки, они стараются узнать об аудитории как можно больше. Именно поэтому на маркетинговом рынке в последние годы так активно используют Big Data. Однако огромные массивы информации и детальные данные о каждой продаже или клике полезны не для всех задач. Брендам важно прислушиваться к своим клиентам, задавать им вопросы и получать обратную связь.

Для развития бизнеса мало простого представления о том, как потребители взаимодействуют с брендом — его продуктами и сервисами. Необходимо понимать, чем живут эти люди, как они взаимодействуют с окружающими, каких взглядов придерживаются и какие ценности разделяют. Понимать их как людей, а не просто как цифры в таблице.

Сделать общение с брендом запоминающимся для потребителя возможно. Глава digital-направления Colenso BBDO Мэтт Барнс считает, что для этого в первую очередь нужно получить обратную связь. То, что часто называют сложными и длинными словами «человекоориентированность» и «клиентоориентированность», в действительности является просто разговором с людьми, получением мнений от тех, кто будет использовать ваши продукты и услуги. Потребителям нравится, когда их мнение имеет значение для компании. Так бренду удастся создать что-то по-настоящему нужное, интересное его аудитории, а иногда и нечто грандиозное. Часто услышанные люди становятся адвокатами бренда — наиболее лояльными потребителями, которые важны для любой компании.

Здорово, что все большее число компаний понимает значение обратной связи. Последний отчет Gartner CMO Spend Survey 2018-19 показал, что «маркетинговая и клиентская аналитика» и «клиентский опыт» — два ключевых направления, в которые компании планируют инвестировать свои бюджеты. Бренды начинают осознавать, что для построения запоминающейся коммуникации важно знать, что потребители думают о продукте. И получить такие данные можно лишь из одного источника — от самих клиентов.

В противовес глубокой аналитике Big Data получение обратной связи от клиентов называют Small Data. Малые данные — это именно то, что позволяет компаниями понимать мысли и чувства своей аудитории. И работа в этом направлении должна быть постоянной.

По данным исследовательской компании FocusVision, 87% респондентов для анализа клиентских реакций и предпочтений используют опросы. 72% получают обратную связь с помощью тех или иных видов интервью, а 71% — с помощью фокус-групп. В первую очередь изучение Small Data используется компаниями для анализа потребительского опыта, но также оно помогает готовить стратегию бренда и понимать, как он воспринимается аудиторией.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Сотворчество с потребителями требует от компаний готовности к тестированию и обучению, способности трансформировать изначальную идею или даже отказаться от нее, если она не найдет отклика в сердцах клиентов. Традиционно создание правильного пользовательского опыта основывается на соответствии ожиданиям. Однако в некоторых случаях именно готовность к неудаче и смелость порой позволяют не только удовлетворять потребности клиентов, но и адаптироваться к актуальным трендам.

В 2019 году, вероятно, победу одержат те компании, которые смогут понять правду о своих потребителях, связать свои сообщения с жизнью простых людей, для которых и создаются продукты. Примером может стать рекламная кампания Nike с участием Колина Каперника. Пока одни поклонники бренда устроили скандал с призывами сжигать фирменную продукцию, онлайн-продажи Nike выросли на 31%. Относится к подобным кейсам можно по-разному, но если компания не понимает свою аудиторию, ей грозят неудачи. Во времена экономики впечатлений без этих самых впечатлений уже не обойтись.

Схожего мнения придерживаются и российские эксперты. На вопросы AdIndex многие из них ответили, что роль Small Data действительно высока. Кроме того, получение и обработка Small Data часто обходится намного дешевле сбора информации о вкладе рекламных источников в продажу, интересах и поведении клиентов на сайте. В то же время не исключено, что с развитием машинных алгоритмов необходимость в живом общении специалистов компаний с потребителями уменьшится.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоКонстантин Кобцев, руководитель digital-отдела агентства TotalView

Многие маркетологи, без сомнения, скажут о Big Data, если спросить, какой сейчас самый главный тренд. Однако мало кто задумывается, что чем более Big эти самые данные, тем сложней их анализировать. На это может уйти много времени, а написание собственных алгоритмов для обработки всей накопленной информации может быть еще и очень затратным занятием.

Со Small Data все значительно проще. Для их хранения порой достаточно одного компьютера, а анализировать их можно при помощи стандартного и доступного ПО. Например, Excel. Как показывает практика, решения, принятые на основе анализа Small Data, зачастую оказываются более «человечными» и более понятными конечным потребителям.

Это не значит, что всем теперь нужно срочно забыть про Big Data и переключаться на Small Data. Эти два подхода могут прекрасно сосуществовать и дополнять друг друга. Каждый из них будет просто решать свои задачи.

BD — это сбор всех доступных данных с целью четкого сегментирования аудитории, выявления неочевидных инсайтов, настроек таргетинга в рекламных кампаниях и т. д. SD собираются, как правило, под конкретную задачу или проект с целью изучения клиентского опыта общения с брендом.

Для того чтобы заполучить лояльного клиента, не обязательно создавать нечто восхитительное — нужно просто проявлять уважение к покупателям и постараться делать их опыт пользования продуктом / брендом позитивным.

В наши дни, на мой взгляд, для сбора SD не обязательно прибегать к видеоинтервью. Этот процесс можно организовать, например, и в мобильном приложении. Некоторые бренды предлагают поделиться своим мнением на сайте, обещая за это дополнительную скидку на следующую покупку. Так что вариантов много. Нужно только захотеть «услышать» потребителя и, что более важно, захотеть «ответить» ему.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоДмитрий Юхневич, COB LT Digital Group

В мире технологического маркетинга очень легко потеряться за цифрами и терминами. Сами по себе большие данные дают возможность брендам оценивать качество своих продуктов и создавать на основе получаемых данных нечто новое, усовершенствованное. На уровне таких объемов точность попадания в целевую аудиторию и эффективность работы рекламных сообщений увеличилась. Цепочка триггеров аналитических систем усложнилась, но на уровне предпосылок к целевым действиям они пока не могут делать правильные выводы. Так называемый Customer Experience формируется из многих факторов, которые недоступны для сбора digital-инструментами. Автоматизированные системы не способны сегодня изучать эмоциональную вовлеченность, а задавая вопрос участнику исследования напрямую, мы получаем его намерение и осознанный ответ с учетом тех особенностей оцениваемого продукта, на которых потребитель сконцентрировал свое внимание. Если сложить вместе скрытые и явные факторы вовлечения, мы получим полную картину. Именно поэтому большинство крупнейших брендов продолжают собирать фидбэк напрямую от своих клиентов. Сам факт того, что бренд организует подобные исследования, уже говорит о его отношении к мнению потребителей.

Несмотря на то, что комплексный подход (онлайн+офлайн) пока остается единственно верным для оценки Customer Experience, крупнейшие игроки рынка digital могут удаленно собирать видео- и аудиоинформацию, анализ которой восполняет часть недостающих сведений о пользователях из офлайн. Однако такой подход к изучению user experience все еще имеет недостатки как с технологической, так и с морально-правовой точки зрения. Часто в разговоре о точности и качестве собираемых данных всплывает тема профилирования и использования нестандартных алгоритмов оценки. Буквально недавно в банковской среде говорили о психологическом профилировании заемщиков, которое будет помогать оценивать рискованность выдачи кредита и прогнозировать вероятность последующей выплаты. Чем полнее будут профили, создаваемые системами, тем точнее бренды будут попадать в свою целевую аудиторию. Главное, не забывать, что дело не продажах, а в самих продуктах.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоАндрей Зайко, руководитель отдела аналитики Adventum

Чтобы улучшать свой продукт и обходить конкурентов в гонке за клиентов, компании все чаще начинают использовать данные. Всего два года назад наши клиенты даже не задумывались о том, что нерекламная аналитика может им дать хоть какое-то преимущество и увеличить долю на рынке. Однако в 2018 году положение дел изменилось: компании активно собирают все доступные данные для оптимизации продукта и маркетинга. Обратная связь от потребителя является важной частью аналитических данных, в которых можно найти много полезных инсайтов об улучшении продукта и повышении его конкурентоспособности. К тому же получение и обработка Small Data обходится намного дешевле данных о вкладе рекламных источников в продажу, интересах и поведении на сайте.

В 2019 году используются все те же методы получения обратной связи от клиентов, что и ранее. Самые популярные:

Применять абсолютно все методы не имеет смысла. Часть из них дешевы в использовании, часть — требуют покупки дорогостоящего программного обеспечения и выделения штата сотрудников. Нужный метод получения обратной связи подбирается исходя из возможностей компании и конкретного типа бизнеса.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоИгорь Чикаров, Head of PPC Digital Geeks

Одним из важнейших факторов успешного бизнеса является умение видеть свой продукт глазами клиента. Правильно анализируя Big Data, можно предугадать потребность потребителей, тем самым повысив их лояльность при первом контакте. Можно оценить эффективность от взаимодействия с клиентом по нескольким каналам коммуникации и оптимизировать эти процессы. Иными словами, большие данные позволяют узнать, «кто» является вашим клиентом, «какие» продукты пользуются наибольшим спросом и «откуда» приходят к вам лояльные клиенты. Но этих данных недостаточно, чтобы ответить на вопрос, «почему» одни клиенты покупают у вас, а другие у конкурентов, «почему» одни категории продуктов пользуются повышенным спросом, а другие — наоборот. Только напрямую от потребителей вы сможете узнать, чего именно не хватает вашему продукту или услуге, что необходимо улучшить, чтобы клиент вашего конкурента перешел на вашу сторону.

Именно поэтому аналитика Small Data является не менее полезным и важным инструментом для оценки не только уровня удовлетворенности, но и причин такого впечатления от вашего продукта.

По-прежнему актуальными инструментами оценки Customer Experience являются:

В последнее время также очень популярным инструментом контакта с потребителем стали мессенджеры, а вот звонки по скрипту уходят на второй план, т. к. этот способ получения обратной связи, пожалуй, самый навязчивый.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоМикаэль Гусейнов, управляющий партнер Scanners

Big Data — технология, которая в маркетинге приживается лучше всего, но в 2019-20 гг. она пока не может полностью заменить все остальные инструменты изучения consumer insights. Как театр начинается с гардероба, так и изучение опыта потребителя пока начинается с вопросов, заданных голосом живого человека, либо аналога голосового общения — чатов, но с живыми людьми по ту сторону экрана. Например, любой пользователь, столкнувшийся после общения с госбанками с чатиком Тинькофф или Альфа-банка, обычно переживает позитивный опыт, граничащий с изумлением. Появляются все новые сервисы личных помощников с использованием чатов, бизнес в соцсетях также с использованием чатов в работе продавца растет семимильными шагами. В этих примерах Big Data пока не может конкурировать с живым общением, но, вероятно, это дело трех-четырех лет, пока нейронные сети и другие технологии не обучат голосовых помощников быстро подстраиваться под отдельные индивидуальности.

В 2019 году чат-боты выйдут на новый уровень качества, и через них можно будет получать существенно больше информации о потребительском опыте, чем сейчас.

Также расширится инструментарий опросов в соцсетях — потребители проводят там большинство времени интернет-потребления; для этого у таких опросов появятся более дружелюбные интерфейсы и системы поощрений за прохождения.

Кроме того, данные о потребительском опыте можно уже сейчас получать и пассивными методами без персонального диалога с потребителем: для этого достаточно задать правильный сценарий для сбора отзывов пользователей по ключевым словам и активным действиям в социальных сетях в любой из мониторинговых метрик для социальных сетей.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что этоАндрей Амирян, New Business Director SA Digital

Сторонники бренда — одна из важнейших и вместе с тем сложнейших категорий аудитории, которую надо формировать путем соприкосновения эмоций пользователя и той истории, которую транслирует бренд. Хорошими примерами подобной коммуникации служат кампании Ferrero, Nike, Coca-Cola. Просто знать и понимать классическую воронку пользователя недостаточно, и при общении с клиентами мы все чаще сталкиваемся с задачей выделить из общего потока тех, кто максимально приближен к идее, миссии бренда.

Для формирования целевого образа необходимо определять все точки соприкосновения с пользователем, благодаря чему получается подобие сценария фильма, где главный герой — пользователь, а точки соприкосновения — единая история, наполненная особой эмоциональной частью.

Источник

Что такое Small Data

В рунете до сих пор нет внятного определения, что такое small data, хотя, казалось бы, о больших данных (big data) говорят уже давно. Эти две формы данных похожи и не похожи друг на друга одновременно. Разбираемся, что к чему.

Small data что это. Смотреть фото Small data что это. Смотреть картинку Small data что это. Картинка про Small data что это. Фото Small data что это

Small Data. Определение

Малые данные (small data) — это когда анализируется информация об одном человеке и делаются выводы (соответственно, большие данные — это когда анализируется множество людей и находятся закономерности в их поведении).

Для сбора, обработки и интерпретации малых данных не нужно много ресурсов: это может сделать и один человек. Такие данные предназначены для решения повседневных задач, в случае с e-commerce: узнавая пол, возраст, физиологические параметры, социальный статус пользователя и другие данные, вы сегментируете пользователей по узнанным критериям и более эффективно проводите рекламные кампании, рекомендуете товары.

Малые данные — это о повседневных задачах: например, собирая электронные адреса покупателей в базу и делая рассылку, вы тоже работаете с малыми данными.

Нужны ли малые данные ритейлерам

У малых данных есть более известный собрат — Big Data, технологический тренд последних нескольких лет. Ритейлерам нужны большие данные: они помогают получить общую картину рынка, увидеть тренды, спрогнозировать спрос или конкуренцию, увеличить продажи за счет понимания поведения покупателей и т.д. Способов применения Big Data действительно много — актуальный пример с рекомендательными системами: они используют большие данные и сложные программные алгоритмы, чтобы спрогнозировать потребности и интересы пользователя по его действиям, сравнивая его модель поведения с тысячами других похожих пользователей. После анализа биг дата такие системы предлагают ему наиболее релевантные товары.

Но пример выше с рекомендательными системами — скорее, единичный случай в онлайн-ритейле, когда бы большие данные применялись так просто и с таким уровнем автоматизации. На деле получается, что если просто взять все эти данные о пользователях и отдать их ритейлу, то единицы будут заниматься анализом и учитывать их при разработке рекламных кампаний или планировании ассортиментна. Причины банальны: сложно, долго, а если писать программные алгоритмы для анализа — дорого.

С малыми данными попроще. На то есть как минимум три причины:

В книге « Принципы Больших Данных » содержатся ключевые отличия малых и больших данных. Приведем их здесь, чтобы окончательно понять суть вопроса.

Small DataBig Data
ЦелиОтвет на конкретный вопрос или решение определенной задачи.Есть нечеткая цель и представление о том, что источник больших данных будет содержать и как будут структурированы данные внутри него, как они будут связаны с другими ресурсами и проанализированы.
МестонахождениеКак правило, содержатся в одной компании, часто на одном компьютере и иногда в одном файле.Распространены по всей Сети, обычно хранятся на нескольких серверах, расположенных в самых разных местах Земли.
Структура и содержаниеОбычно хорошо структурированные данные. Область данных: одна дисциплина или субдисциплина. Часто хранятся в виде однородных данных в упорядоченных таблицах.Большой объем неструктурированных данных (например, текстовые документы, изображения, фильмы, звукозаписи, физические объекты). Предметом больших данных могут быть сразу несколько дисциплин, у каждого объекта могут быть связи с другими, казалось бы, никак не связанными, информационными ресурсами.
Подготовка данныхОбычно люди, которые занимались подготовкой данных, их и используют.Данные поступают из многих источников, подготовкой занимается множество людей. При этом используют данные другие люди, не принимавшие участия в подготовке.
ДолговечностьХранятся в течение ограниченного периода времени (обычно не более 7 лет), а затем архивируются.Данные хранятся неограниченное количество времени. В идеале, когда текущий источник данных прекращает существование, данные из него «всасываются» в другой источник.
ИзмерениеКак правило, данные измерены одним экспериментальным протоколом.Так как данные поступают в разных электронных форматах, они могут быть измерены разными протоколами. Проверка качества больших данных — одна из самых сложных задач.
ВоспроизводимостьПроекты повторяются: если есть сомнения в качестве данных или обоснованности выводов, весь проект может быть повторен для получения нового набора данных.Тиражирование данных большого проекта неосуществимо. Если было замечено, что присутствуют некачественные данные, остается только надеяться, что кто-то найдет их и отметит.
СтоимостьСтоимость проекта ограничена. Лаборатории и учреждения, как правило, могут оправиться от случайного провала.Проекты стоят неприлично дорого. Некачественные данные могут привести компанию к банкротству, массовым увольнениям и прекращению существования источника данных.
СамоанализКаждая единица данных идентифицируется по строке и столбцу, зная их названия, вы можете найти и указать все ячейки данных в таблице.Если источник данных не исключительно хорошо структурирован, он может быть непонятен. Для анализа применяются машинные алгоритмы.
АнализВ большинстве случаев все данные проекта могут быть проанализированы сразу и в полном объеме.Обычно анализируются поэтапно (за исключением машинного анализа на суперкомпьютере или нескольких компьютерах сразу). Данные проходят этапы: извлечение, обзор, ограничение, нормализация, трансформация, визуализация, интерпретация и повторный анализ различными методами.

Надеемся, различия стали более очевидными. Так как наш продукт напрямую связан как с Big Data, так и со Small Data, поясним роль последних в работе REES46.

Малые данные в рекомендательной системе

Когда в магазин приходит новый пользователь, для сервиса рекомендаций он — чистый лист. О нем ничего не известно, коллаборативная фильтрация и другие методы обработки больших данных не работают: ведь мы не знаем, что пользователь покупал, что смотрел и т.д.

Поэтому REES46 наравне с большими использует малые данные, делая на их основе выводы и превращая их в качественные товарные рекомендации.

Пример 1. Покупатель просмотрел несколько товаров в категории «детская одежда». Система делает вывод, что у пользователя есть дети, а глядя на параметры просмотренной одежды, делает запись о том, какого пола ребенок и сколько ему лет. Далее этому пользователю рекомендуются подходящие ему детские товары, при этом используется Small Data: таким образом компенсируются недостатки Big Data.

Пример 2. Покупатель положил в корзину корм Pro Plan для собак. По объему сервис рекомендация делает предположение о том, насколько это крупная порода собаки, а по марке предполагает, что покупателю подойдут товары из высокого ценового сегмента (корм качественный и дорогой). Поэтому в рекомендуемых товарах будут выводиться только качественные аксессуары или игрушки для крупных собак — и это повысит вероятность покупки.

В целом, малые данные — это то, чем нужно пользоваться, когда на обработку Big Data нет времени, вычислительных мощностей или когда о пользователе ничего не известно.

Самое то для принятия решений здесь и сейчас.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *