Как вывести уравнение графика в excel
Построение функции тренда в Excel. Быстрый прогноз без учета сезонности
Глядя на любой набор данных распределенных во времени (динамический ряд), мы можем визуально определить падения и подъемы показателей, которые он содержит. Закономерность подъемов и падений называется трендом, который может говорить о том, увеличиваются или уменьшаются наши данные.
Пожалуй, цикл статей о прогнозировании я начну с самого простого — построении функции тренда. Для примера возьмем данные о продажах и построим модель, которая опишет зависимость продаж от времени.
Базовые понятия
Думаю, еще со школы все знакомы с линейной функцией, она как раз и лежит в основе тренда:
Y — это объем продаж, та переменная, которую мы будем объяснять временем и от которого она зависит, то есть Y(t);
t — номер периода (порядковый номер месяца), который объясняет план продаж Y;
a0 — это нулевой коэффициент регрессии, который показывает значение Y(t), при отсутствии влияния объясняющего фактора (t=0);
a1 — коэффициент регрессии, который показывает, на сколько исследуемый показатель продаж Y зависит от влияющего фактора t;
E — случайные возмущения, которые отражают влияния других неучтенных в модели факторов, кроме времени t.
Построение модели
Итак, мы знаем объем продаж за прошедшие 9 месяцев. Вот, что из себя представляет наша табличка:
Следующее, что мы должны сделать — это определить коэффициенты a0 и a1 для прогнозирования объема продаж за 10-ый месяц.
Определение коэффициентов модели
Строим график. По горизонтали видим отложенные месяцы, по вертикали объем продаж:
Если вы делаете все в MS Excel, то правой кнопкой мыши кликаем на график и в выпадающем меню выбираем «Добавить линию тренда».
По умолчанию строится линейная функция. Справа выбираем «Показывать уравнение на диаграмме» и «Величину достоверности аппроксимации R^2».
Вот, что получилось:
На графике мы видим уравнение функции:
Она описывает объем продаж в зависимости от номера месяца, на который мы хотим эти продажи спрогнозировать. Рядом видим коэффициент детерминации R^2, который говорит о качестве модели и на сколько хорошо она описывает наши продажи (Y). Чем ближе к 1, тем лучше.
У меня R^2 = 0,75. Это средний показатель, он говорит о том, что в модели не учтены какие-то другие значимые факторы помимо времени t, например, это может быть сезонность.
Прогнозируем
Чтобы рассчитать продажи за 10-ый месяц, подставляем в функцию тренда 10 вместо x. То есть,
Получаем 153664 продажи в следующем месяце. Если добавим новую точку на график, то сразу видим, что R^2 улучшился.
Таким образом вы можете спрогнозировать данные на несколько месяцев вперед, но без учета других факторов ваш прогноз будет лежать на линии тренда и будет не таким информативным как хотелось бы. К тому же, долгосрочный прогноз, сделанный таким способом будет очень приблизительным.
Повысить точность модели можно добавлением сезонности к функции тренда, что мы и сделаем в следующей статье.
Линия тренда в Excel. На разных графиках
Существует множество сфер, где может использоваться трендовая линия. Но наиболее популярной из них, безусловно, являются финансовые рынки. В бизнесе тоже она применяется довольно часто для составления отчетов и прогнозирования возможных перспектив развития проекта или компании в целом.
Также она будет полезным инструментом в тех областях человеческой деятельности, где можно составлять прогнозы, ориентируясь на статистические данные. А таких сфер значительно больше, чем может показаться на первый взгляд. В частности, к ним относятся социология, психология, программирование (использование математических моделей позволяет автоматизировать процесс прогнозирования) и так далее. Особенно это полезно в сочетании с качественным анализом информации.
Основная проблема почти любого графика с большим количеством информации в том, что в нем показания очень вариативны. Поэтому возможно появление большого количества данных, которые мешают понять, какая действительно тенденция наблюдается в этой отрасли.
Трендовая линия – это классический статистический инструмент, позволяющий без особого опыта предсказать, в каком направлении будет двигаться целевой показатель через некоторое время и в какой точке будет. Также он дает возможность косвенно определить факторы, которые влияют на образование данного тренда. Правда, этого уже чисто статистическими методами сделать не получится, нужно понимать фундаментальные закономерности, которые влияют на формирование тенденции.
Как добавить линию тренда на график Excel
Трендовая линия дает возможность понять действующие тенденции определенного показателя. И поскольку особенно часто сей инструмент сейчас используется на финансовых рынках, то мы будем приводить на этом примере.
Трендовая линия на финансовых рынках является классическим инструментом анализа динамики котировок, которая используется еще с момента создания первой фондовой биржи. Но одной ее недостаточно, и сейчас разрабатываются все более новые технические индикаторы, которые позволяют значительно улучшить качество прогнозов. Существует еще отдельная категория индикаторов, которая позволяет непосредственно предвидеть разворот тенденции. В то же время трендовая линия дает возможность лишь констатировать имеющееся направление цены.
Поэтому рекомендуется использовать трендовую линию совместно с осцилляторами. Это категория технических индикаторов, которая успевает заметить изменение тренда до того, как это сделает трендовая линия.
Создание трендовой линии возможно стандартными средствами Excel. Она еще до сих пор активно используется, поэтому уметь ее строить надо. Давайте разберемся, как это сделать.
Процесс построения графика
Чтобы процесс построения трендовой линии был успешным, график должен соответствовать математической функции. Чтобы создать график, необходимо следовать этому алгоритму:
После того, как пользователь сделает клик по графику, он сможет воспользоваться еще одной панелью, через которую и осуществляется добавление линии тренда на график.
Создание линии тренда
Итак, давайте перейдем на панель «Работа с диаграммами». Там находится вкладка «Макет», через которую и осуществляется добавление линии тренда на график. После того, как мы нажмем одноименную кнопку, появится возможность выбрать способ приближения. Нужно выбрать линейный тип. Затем появится черная линия, которая будет выражать действующую тенденцию.
Важно понимать, что некоторые типы графиков не поддерживают линию тренда. Поэтому рекомендуется использовать самые стандартные.
Все остальные разновидности графиков дают возможность добавлять линию тренда на них.
Настройка линии
Следующий этап – настройка. Сначала нужно добавить уравнение в график. Это делается путем двухкратного нажатия левой кнопкой мыши по диаграмме. Затем пользователю необходимо выбрать опцию «Показать уравнение на диаграмме».
Если на диаграмме находится больше одного графика, то нужно выбрать наиболее подходящий для прогнозирования.
Нужно запомнить следующие пункты, если нужно отрегулировать определенные параметры линии тренда:
Прогнозирование
Самые точные прогнозы возможны, если сделать тип графика «гистограмма». Это дает возможность сопоставить уравнения. Чтобы это сделать, надо следовать такому алгоритму:
Теперь пользователь может видеть оба графика. Они содержат одну и ту же информацию, но дают возможность составлять более точные прогнозы, поскольку каждый тип графика использует свое уравнение для построения трендовой линии.
Далее перед нами стоит задача сопоставить разные диаграммы. Чтобы это сделать, надо включить визуальное отображение. Для этого выполняются следующие шаги:
С помощью таких параметров можно заметить, что угол наклона линии тренда отличается в зависимости от используемого графика, но все равно направление не меняется. Из этого можно сделать вывод, что недостаточно использовать лишь одну линию тренда, чтобы составлять надежные прогнозы на финансовых рынках.
Если речь идет о торговле на финансовых рынках, то использования технических индикаторов (коим трендовая линия и является) недостаточно. Нужно еще понимать фундаментальные законы экономики и общие качественные тенденции развития отрасли. Иначе даже при высоком коэффициенте достоверности реальная точность составляемых прогнозов будет очень страдать.
Уравнение линии тренда в Excel
Только лишь добавить линию тренда недостаточно, нужно еще уметь выбирать правильное уравнение, чтобы данные отображались максимально корректно. Определить, какое из них правильное, можно, ориентируясь на число достоверности. Если величина отличается от единицы, то диаграмма была настроена неверно. Соответственно, нужно по-другому отобразить график или использовать другие уравнения для расчета.
Линейная аппроксимация
Давайте приведем такой кейс: сотрудник заключал сделки в течение десяти месяцев, и каждый месяц им было совершено определенное их количество.
Построение диаграммы будет осуществляться с опорой на эти данные. Нужно просто выполнить некоторые действия, а именно:
Предположим, у нас есть график, где введены данные и выбран тот тип отображения графика, при котором достоверность равна 0,9929, а исходя из данных диаграммы, можно сделать вывод, что сотрудник работает больше, чем до того. В таком случае с помощью графика можно определить, сколько сделок ожидается совершить в будущем. Чтобы это сделать, нужно в используемую формулу вставить номер периода.
Экспоненциальная линия тренда
Этот тип линии тренда знаком сейчас многим. По этому сценарию развиваются все пандемии, а также ряд других процессов. Характерная особенность этого вида линии тренда – цифры постоянно возрастают в геометрической прогрессии. Например, 1,2,4,8 и так далее. По похожему сценарию как раз и развиваются эпидемии, поскольку чем больше больных, тем большему количеству людей может передаться заболевание.
Мы попробуем абстрагироваться от неприятных вещей и перейдем на другие сферы, например, бизнес.
Допустим, вы являетесь менеджерами, которым надо проанализировать, сколько энергии было отпущено за определенный период. Использоваться будут условные значения, которые могут расходиться с действительностью. Просто для демонстрации примера.
Теперь, основываясь на этих данных, выполняем построение графика. Далее добавляем экспоненциальную линию тренда.
2
Достоверность линии тренда в рассматриваемом нами примере составляет 0,938, что говорит, что вероятность ошибки довольно низкая. Следовательно, прогнозам можно доверять.
Логарифмическая линия тренда
Она применяется в ситуациях, когда показатели могут резко меняться. Например, сперва наблюдается стремительный рост, после чего наступает период стабильности. С помощью логарифмической линии тренда можно попытаться предсказать, насколько удачными будут продажи товара, который только появился.
Сперва компании нужно привлекать новых клиентов. Поэтому рост будет стремительный. Дальше опора идет в первую очередь на то, чтобы сделать лояльными к себе тех, кого уже удалось привлечь. Следовательно, точка приложения усилий меняется и соответственно, корректируется прирост клиентской базы.
Давайте сделаем к этому примеру такой график.
3
В этом случае также ошибка аппроксимации минимальная, поэтому полученным сведениям можно доверять. Теперь давайте попробуем предположить, насколько интенсивными будут продажи в будущем. Чтобы это сделать, необходимо подставить номер соответствующего периода в качестве значения переменной x.
Как вариант, возможна следующая таблица с прогнозами.
4
В нашем кейсе для того, чтобы приблизительно понять, как в будущем будет реализовываться продукция, была применена такая формула: =272,14*LN(B 18)+287,21. Где В18 – номер периода.
Полиномиальная линия тренда в Эксель
Эта линия тренда характерна для волатильных (изменчивых) показателей. Очень хорошо его использовать для торговли криптовалютами или другими высоко рисковыми активами.
Для линии тренда этого типа характерно то увеличение, то уменьшение показателей в достаточно широком диапазоне. Его использование возможно в том числе и для обработки огромных массивов информации количественного типа. Особенно эта линия тренда часто используется при наличии большого количества экстремумов на графике (то есть, минимумов и максимумов).
График цены на нефть является наиболее удобным способом демонстрации того, как работает эта модель. Чтобы величина достоверности была близкой к единице, пришлось выставить шестую степень. Но такая линия тренда дает возможность составлять достаточно верные прогнозы.
5
Выводы
Построение линии тренда – это довольно простая процедура. А вот анализ данных с ее использованием – уже задачка посложнее. Но с помощью встроенных средств Excel можно составлять эффективные прогнозы развития самых разных показателей из разных сфер. И хотя использование трендовой линии по большей части автоматизировано в современных программах, иногда может потребоваться использование Excel для этой цели.
Вообще, для составления эффективных прогнозов одной трендовой линии недостаточно. Это не панацея, и не стоит надеяться, что настолько элементарная математическая модель способна творить чудеса. Тем не менее, это один из самых простых элементов статистического анализа. И теперь вы знаете, как его использовать в реальной работе.
5 способов расчета значений линейного тренда в MS Excel
Добавление трендовой линии на график
Построение графика
Создание линии
Дальнейшая работа будет происходить непосредственно с трендовой линией.
Добавление тренда на диаграмму происходит следующим образом:
Этот способ поможет создать и построить тренд в Excel 2016 или более ранних версиях.
Настройка линии
Прогнозирование
Для визуального отображения нужно сделать следующее:
Базовые понятия
Думаю, еще со школы все знакомы с линейной функцией, она как раз и лежит в основе тренда:
Y — это объем продаж, та переменная, которую мы будем объяснять временем и от которого она зависит, то есть Y(t);
t — номер периода (порядковый номер месяца), который объясняет план продаж Y;
a0 — это нулевой коэффициент регрессии, который показывает значение Y(t), при отсутствии влияния объясняющего фактора (t=0);
a1 — коэффициент регрессии, который показывает, на сколько исследуемый показатель продаж Y зависит от влияющего фактора t;
E — случайные возмущения, которые отражают влияния других неучтенных в модели факторов, кроме времени t.
Определение коэффициентов модели
Строим график. По горизонтали видим отложенные месяцы, по вертикали объем продаж:
Если вы делаете все в MS Excel, то правой кнопкой мыши кликаем на график и в выпадающем меню выбираем «Добавить линию тренда».
По умолчанию строится линейная функция. Справа выбираем «Показывать уравнение на диаграмме» и «Величину достоверности аппроксимации R^2».
Вот, что получилось:
На графике мы видим уравнение функции:
Она описывает объем продаж в зависимости от номера месяца, на который мы хотим эти продажи спрогнозировать. Рядом видим коэффициент детерминации R^2, который говорит о качестве модели и на сколько хорошо она описывает наши продажи (Y). Чем ближе к 1, тем лучше.
У меня R^2 = 0,75. Это средний показатель, он говорит о том, что в модели не учтены какие-то другие значимые факторы помимо времени t, например, это может быть сезонность.
Способ расчета значений линейного тренда в Excel с помощью графика
Выделяем анализируемый объём продаж и строим график, где по оси Х — наш временной ряд (1, 2, 3… — январь, февраль, март …), по оси У – объёмы продаж. Добавляем линию тренда и уравнение тренда на график. Получаем уравнение тренда y=135134x+4594044
Для прогнозирования нам необходимо рассчитать значения линейного тренда, как для анализируемых значений, так и для будущих периодов.
При расчете значений линейного тренде нам будут известны:
Рассчитываем значения тренда для каждого периода времени от 1 до 25, а также для будущих периодов с 26 месяца до 36.
Например, для 26 месяца значение тренда рассчитывается по следующей схеме: в уравнение подставляем x=26 и получаем y=135134*26+4594044=8107551
27-го y=135134*27+4594044=8242686
Способ расчета значений линейного тренда в Excel — функция ТЕНДЕНЦИЯ
Рассчитаем значения линейного тренда с помощью стандартной функции Excel:
=ТЕНДЕНЦИЯ(известные значения y; известные значения x; новые значения x; конста)
Подставляем в формулу
Для того чтобы рассчитать значения тренда для всего временного диапазона, в “новые значения x” вводим диапазон значений X, выделяем диапазон ячеек равный диапазону со значениями X с формулой в первой ячейке и нажимаем клавишу F2, а затем — клавиши CTRL + SHIFT + ВВОД.
Уравнение линии тренда в Excel
В предложенном выше примере была выбрана линейная аппроксимация только для иллюстрации алгоритма. Как показала величина достоверности, выбор был не совсем удачным.
Следует выбирать тот тип отображения, который наиболее точно проиллюстрирует тенденцию изменений вводимых пользователем данных. Разберемся с вариантами.
Линейная аппроксимация
Ее геометрическое изображение – прямая. Следовательно, линейная аппроксимация применяется для иллюстрации показателя, который растет или уменьшается с постоянной скоростью.
Рассмотрим условное количество заключенных менеджером контрактов на протяжении 10 месяцев:
На основании данных в таблице Excel построим точечную диаграмму (она поможет проиллюстрировать линейный тип):
Выделяем диаграмму – «добавить линию тренда». В параметрах выбираем линейный тип. Добавляем величину достоверности аппроксимации и уравнение линии тренда в Excel (достаточно просто поставить галочки внизу окна «Параметры»).
Обратите внимание! При линейном типе аппроксимации точки данных расположены максимально близко к прямой. Данный вид использует следующее уравнение:
Прямая линия на графике отображает стабильный рост качества работы менеджера. Величина достоверности аппроксимации равняется 0,9929, что указывает на хорошее совпадение расчетной прямой с исходными данными. Прогнозы должны получиться точными.
Чтобы спрогнозировать количество заключенных контрактов, например, в 11 периоде, нужно подставить в уравнение число 11 вместо х. В ходе расчетов узнаем, что в 11 периоде этот менеджер заключит 55-56 контрактов.
Экспоненциальная линия тренда
Данный тип будет полезен, если вводимые значения меняются с непрерывно возрастающей скоростью. Экспоненциальная аппроксимация не применяется при наличии нулевых или отрицательных характеристик.
Построим экспоненциальную линию тренда в Excel. Возьмем для примера условные значения полезного отпуска электроэнергии в регионе Х:
Строим график. Добавляем экспоненциальную линию.
Уравнение имеет следующий вид:
Показатель величины достоверности аппроксимации составил 0,938 – кривая соответствует данным, ошибка минимальна, прогнозы будут точными.
Логарифмическая линия тренда в Excel
Используется при следующих изменениях показателя: сначала быстрый рост или убывание, потом – относительная стабильность. Оптимизированная кривая хорошо адаптируется к подобному «поведению» величины. Логарифмический тренд подходит для прогнозирования продаж нового товара, который только вводится на рынок.
На начальном этапе задача производителя – увеличение клиентской базы. Когда у товара будет свой покупатель, его нужно удержать, обслужить.
Построим график и добавим логарифмическую линию тренда для прогноза продаж условного продукта:
R2 близок по значению к 1 (0,9633), что указывает на минимальную ошибку аппроксимации. Спрогнозируем объемы продаж в последующие периоды. Для этого нужно в уравнение вместо х подставлять номер периода.
Период | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
Прогноз | 1005,4 | 1024,18 | 1041,74 | 1058,24 | 1073,8 | 1088,51 | 1102,47 |
Для расчета прогнозных цифр использовалась формула вида: =272,14*LN(B18)+287,21. Где В18 – номер периода.
Общая информация
Линия тренда – это инструмент статистического анализа, который позволяет спрогнозировать дальнейшее развитие событий. Чтобы построить кривую, необходимо иметь массив данных, который отображает изменение величины во времени. На основании этой информации строится график, а затем применятся специализированная функция. Рассмотрим изменение цены золота за грамм в долларах с 2015 по 2019 год.
На заметку! Если линия тренда не активна, то используется не тот тип диаграммы. Данная функция работает только с диаграммами типа гистограмма, график, линейчатая и точечная.
6. Так выглядит линия тренда на графике.
На заметку! Построение линии приближения идентично для редакторов 2007, 2010 и 2016 годов выпуска.
Возможности инструмента
Рассмотрим подробнее настройки функции. Для перехода в окно параметров из выпадающего списка нужно выбрать последнюю строчку.
Окно содержит четыре настройки, в которые входят цвет, объем и тип линии, а также параметры самого инструмента.
Параметры линии тренда можно условно поделить на четыре блока:
Выведем на исходный график уравнение линии и коэффициент достоверности.
Как видите, значение близко к 0,5, это говорит о низкой достоверности полученной линии тренда, и дальнейший прогноз будет ошибочным.
Разновидности
1 Линейная аппроксимация отлично подойдет для исследования величины, которая стабильно растет или убывает. Тогда кривая будет иметь вид прямой. Формула будет содержать одну переменную. Коэффициент достоверности близок к единице, что говорит о высокой точности совпадения прямой и массива данных. На основании такой линии тренда прогноз будет достаточно точным.
2. Экспоненциальная кривая используется только для массивов с положительными значениями, которые изменяются непрерывно.
3. Логарифмическую линию тренда целесообразнее использовать, если на первоначальном этапе наблюдается резкое увеличение или снижение показателя, а потом наступает период стабильности. Здесь формула содержит логарифм натуральный.
4. Полиномиальная аппроксимация применяется при большом количестве неоднородных данных. В основе лежит степенное уравнение, при этом количество степеней зависит от числа максимумов. Применим этот тип для первоначального примера с золотом.
Уравнение показывает переменные до третьей степени, поскольку график имеет два пика. Также видим, что коэффициент достоверности близок к единице (вместо 0,5 при линейной аппроксимации), значит линия тренда выбрана правильно и дальнейший прогноз будет точным.
Как видите, для статистического анализа данных необходимо правильно выбрать тип математического уравнения, которое максимально точно будет соответствовать характеру изменения величины. На основании полученных кривых можно осуществлять прогноз, подставляя в уравнение необходимое число.
Разбираемся с трендами в MS Excel
Большой ошибкой со стороны владельца сайта будет воспринимать диаграмму как есть. Да, невооруженным взглядом видно, что синий и оранжевый столбики «осени» выросли по сравнению с «весной» и тем более «летом». Однако важны не только цифры и величина столбиков, но и зависимость между ними. То есть в идеале, при общем росте, «оранжевые» столбики просмотров должны расти намного сильнее «синих», что означало бы то, что сайт не только привлекает больше читателей, но и становится больше и интереснее.
Что же мы видим на графике? Оранжевые столбики «осени» как минимум ни чем не больше «весенних», а то и меньше. Это свидетельствует не об успехе, а скорее наоборот — посетители прибывают, но читают в среднем меньше и на сайте не задерживаются!
Зачем нужна линия тренда
Линия тренда «по-простому», это непрерывная линия составленная на основе усредненных на основе специальных алгоритмов значений из которых строится наша диаграмма. Иными словами, если наши данные «прыгают» за три отчетных точки с «-5» на «0», а следом на «+5», в итоге мы получим почти ровную линию: «плюсы» ситуации очевидно уравновешивают «минусы».
Исходя из направления линии тренда гораздо проще увидеть реальное положение дел и видеть те самые тенденции, а следовательно — строить прогнозы на будущее. Ну а теперь, за дело!
Как построить линию тренда в MS Excel
На листе диаграммы теперь отображается пунктирная линия тренда. Как видите, она не совпадает на 100% со значениями диаграммы — построенная по средневзвешенным значениям, она лишь в общих чертах повторяет её направление. Однако это не мешает нам видеть устойчивый рост числа посещений сайта — на общем результате не сказывается даже «летняя» просадка.
Линия тренда для столбца «Посетители»
Теперь повторим тот же фокус с «оранжевыми» столбцами и построим вторую линию тренда. Как я и говорил раньше: здесь ситуация не так хороша. Тренд явно показывает, что за расчетный период число просмотров не только не увеличилось, но даже начало падать — медленно, но неуклонно.
Ещё одна линия тренда позволяет прояснить ситуацию
Мысленно продолжив линию тренда на будущие месяцы, мы придем к неутешительному выводу — число заинтересованных посетителей продолжит снижаться. Так как пользователи здесь не задерживаются, падение интереса сайта в ближайшем будущем неизбежно вызовет и падение посещаемости.
Следовательно, владельцу проекта нужно срочно вспоминать чего он такого натворил летом («весной» все было вполне нормально, судя по графику), и срочно принимать меры по исправлению ситуации.