Как достать сд чейнджер бмв е65

В этом блоге я познакомлю вас с некоторыми важными концепциями программирования SAS. Прежде чем мы начнем, важно, чтобы вы познакомились с SAS. Мой предыдущий блог о SAS Tutorial поможет вам понять SAS, его приложения и поможет вам установить SAS University Edition, который мы будем использовать здесь в качестве среды программирования. Интересно, Какие навыки вы должны освоить в этом году? Кроме того, если вы планируете заняться аналитикой данных, сертификационный тренинг SAS-это один из лучших способов начать с того же самого.

Edureka 2019 Tech Career Guide вышел! Самые горячие рабочие роли, точные пути обучения, перспективы отрасли и многое другое в руководстве. Скачай прямо сейчас.

Итак, без дальнейших проволочек, давайте начнем с программирования SAS, не так ли?

Этот блог поможет Вам разобраться в следующих темах:

Прежде чем мы начнем кодирование, я хотел бы кратко изложить вам несколько важных терминов, которые важны для программирования SAS.

Основы программирования SAS

Окна SAS

Крупные организации и учебные заведения предпочитают использовать окна SAS. SAS Windows имеет множество утилит, которые помогают сократить время, необходимое для написания кодов.

На следующем рисунке показаны различные части окон SAS.

SAS-Windows-Программирование SAS-Edureka

  • Окно журнала: это окно выполнения. Здесь вы можете проверить выполнение своей программы. Он также отображает ошибки, предупреждения и заметки.
  • Окно кода: это окно также известно как окно редактора. Рассматривайте его как чистый лист бумаги или блокнот, где вы можете написать свой код SAS.
  • Окно вывода: Как следует из названия, в этом окне отображается вывод программы/ кода, который вы пишете в Редакторе.
  • Окно результатов: это индекс, в котором перечислены все выходные данные программ, запущенных в одном сеансе. Поскольку он содержит результаты определенного сеанса, если вы закроете программу и перезагрузите ее, окно результатов будет пустым.
  • Окно исследования: в нем содержится список всех библиотек в системе. Вы также можете просмотреть поддерживаемые системой файлы здесь.

Некоторые организации используют Linux, однако без графического пользовательского интерфейса вам придется писать код для каждого запроса. Поэтому им неудобно пользоваться.

Наборы данных SAS

Наборы данных SAS называются файлами данных. Файлы данных состоят из строк и столбцов. Строки содержат наблюдения, а столбцы-имена переменных.

Переменные SAS

SAS имеет два типа переменных:

  • Числовые переменные: это тип переменной по умолчанию. Эти переменные используются в математических выражениях.
  • Символьные переменные: символьные переменные используются для значений, которые не используются в математических выражениях.
    Они рассматриваются как текст или строки. Переменная становится символьной переменной, добавляя ’ $ ‘ sign в конце имени переменной.

Библиотеки SAS

Библиотека SAS-это набор файлов SAS, хранящихся в одной папке или каталоге на вашем компьютере.

  • Временная библиотека: в этой библиотеке набор данных удаляется по окончании сеанса SAS.
  • Постоянная библиотека: наборы данных сохраняются постоянно. Следовательно, они доступны в разных сеансах.

Пользователи также могут создать или определить новую библиотеку, известную как пользовательские библиотеки, используя ключевое слово LIBNAME. Это также постоянные библиотеки.

Программирование SAS: структура кода SAS

Программирование SAS основано на двух строительных блоках:

  • Шаг данных: шаг данных создает набор данных SAS, а затем передает данные на шаг PRO C
  • Шаг PRO C: шаг PRO C обрабатывает данные

Программа SAS должна следовать следующим правилам:

  • Почти каждый код будет начинаться либо с данных, либо с шага PRO C
  • Каждая строка кода SAS заканчивается точкой с запятой
  • Код SAS заканчивается ключевым словом RUN или QUI T
  • Коды SAS не чувствительны к регистру символов
  • Вы можете написать код в разных строках или написать несколько операторов в одной строке

Теперь, когда мы увидели несколько основных терминологий, давайте начнем с программирования SAS с помощью этого базового кода:

1

2

3

4

5

6

7

8

9

10

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$;

datalines;

101 Mak SQL

102 Rama SAS

103 Priya Java

104 Karthik Excel

105 Mandeep SAS

;

Run;

В приведенном выше коде мы создали набор данных, называемый Employee_Info. Он имеет три переменные, одну числовую переменную как Emp_Id и две символьные переменные как Emp_Name и Emp_Verticals. Команда Run отображает набор данных в окне вывода.

На рисунке ниже показан вывод вышеупомянутого кода.

Базовая программа-Программирование SAS-Edureka

Предположим, вы хотите увидеть результат в режиме печати, ну вы можете сделать это с помощью процедуры печати PRO C, остальная часть кода остается прежней.

1

2

3

4

5

6

7

8

9

10

11

12

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$;

datalines;

101 Mak SQL

102 Rama SAS

103 Priya Java

104 Karthik Excel

105 Mandeep SAS

;

Run;

PRO C PRINT DAT A=Employee_Info;

Run;

На рисунке ниже показан вывод приведенного выше кода.

SASPRINT-Программирование SAS-Edureka

Мы просто создали набор данных и поняли, как работает процедура печати. Теперь возьмем приведенный выше набор данных и используем его для дальнейшего программирования. Допустим, мы хотим добавить дату присоединения сотрудника к набору данных. Поэтому мы создаем переменную с именем DOJ, вводим ее в качестве входных данных и печатаем результат.

1

2

3

4

5

6

7

8

9

10

11

12

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$ DOJ;

datalines;

101 Mak SQL 18/08/2013

102 Rama SAS 25/06/2015

103 Priya Java 21/02/2010

104 Karthik Excel 19/05/2007

105 Mandeep SAS 11/09/2016

;

Run;

PRO C PRINT DAT A=Employee_Info;

Run;

На приведенном ниже рисунке показан вывод приведенного выше кода. Видно, что переменная была создана, но значение DOJ не было напечатано. Вместо этого мы видим, что точки заменили значения дат.

SAS Code - Программирование SAS-Edureka
Почему это произошло? Ну, а переменная DOJ не имеет суффикса Но введенные нами данные имеют специальный символ‘/Если вы проверите окно журнала, то увидите сообщение об ошибке

Как же нам теперь решить эту проблему? Ну, один из способов решить эту проблему-использовать суффикс ‘$’ для переменной DOJ. Это преобразует переменную DOJ в символ, и вы сможете печатать значения дат. Давайте внесем изменения в код и посмотрим на результат.

1

2

3

4

5

6

7

8

9

10

11

12

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$ DOJ$;

datalines;

101 Mak SQL 18/08/2013

102 Rama SAS 25/06/2015

103 Priya Java 21/02/2010

104 Karthik Excel 19/05/2007

105 Mandeep SAS 11/09/2016

;

Run;

PRO C PRINT DAT A=Employee_Info;

Run;

На выходном экране отобразится следующий вывод.

Дата-Программирование SAS-Edureka
Вы можете видеть, что значения данных отображаются в виде дат путем преобразования DOJ в символ. Однако это временное решение. Позвольте мне объяснить это как?

Ну, представьте себе, что у банка есть подобный набор данных. Набор данных содержит сведения о владельце счета, такие как сумма кредита, рассрочка платежа и срок погашения кредита. Представьте себе, что владелец пропустил свой крайний срок, чтобы заплатить взнос, и банк хочет рассчитать задержку. Банк должен будет рассчитать разницу между крайним сроком и текущей датой.

Но если набор данных Банка содержит даты в символьном формате, то банк не сможет выполнять над ним математические операции. Эта проблема также может повлиять на наш набор данных. Так как же нам решить эту проблему?

Следующая концепция поможет вам преодолеть эту проблему.

Информация и форматы в SAS

Очень важно, чтобы вы хорошо понимали эту тему, если хотите хорошо разбираться в программировании SAS. Если вы помните, я уже упоминал ранее, что SAS имеет два стандартных типа переменных:

  • Числовой
  • Характер

Когда SAS столкнется с нестандартными переменными, SAS выдаст ошибку, или вы не получите желаемый результат. Чтобы преодолеть эту проблему, SAS использует информационные технологии и форматы.

Информат

Информаты обычно используются для чтения или ввода данных из внешних файлов или плоских файлов (например, текстовых файлов или последовательных файлов). Informat инструктирует SAS о том, как считывать данные в переменные SAS. SAS имеет три типа информации: символьную, числовую и дату/ время. Информаты именуются в соответствии со следующей синтаксической структурой:

  • Символ Informat: $INFORMATw.
  • Числовая Информация: INFORMA Tw. Д
  • Дата / Время Informat: INFORMATw.

‘ $ ‘Указывает на информацию о символе. INFORMA T относится к иногда необязательному имени SAS informat. ‘W ‘ обозначает ширину (байты или количество столбцов) переменной. ‘D ‘ используется для числовых данных, чтобы указать количество цифр справа от десятичного знака. Все информаты должны содержать десятичную точку(.) так что SAS может
дифференцировать informat от переменной SAS.

Давайте вернемся к нашему предыдущему коду и посмотрим, поможет ли нам информация о дате и времени. Поэтому давайте изменим код соответствующим образом и добавим к нему информацию о дате следующим образом:

1

2

3

4

5

6

7

8

9

10

11

12

13

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$ DOJ;

INFORMA T DOJ ddmmyy10. ;

datalines;

101 Mak SQL 18/08/2013

102 Rama SAS 25/06/2015

103 Priya Java 21/02/2010

104 Karthik Excel 19/05/2007

105 Mandeep SAS 11/09/2016

;

Run;

PRO C PRINT DAT A=Employee_Info;

Run;

Строка № 3 в коде указывает SAS на чтение переменной ‘date of joining’ (DOJ) с помощью date
informat MMDDY Yw. Для каждого поля даты, занимающего 10 пробелов, квалификатор ‘w. ’ имеет значение 10.

Выходные данные кода будут выглядеть следующим образом.

Программирование Informat-SAS-Edureka

Результат показывает, что у нас все еще нет желаемого результата, вместо этого столбец DOJ содержит некоторые числовые значения, а не даты, которые мы указали. Так почему же это так? Ну, как только дата считывается с помощью date informat, SAS сохраняет дату в виде числа. Это означает, что он читается как число дней между датой и 1 января 1960 года (например: 3/15/1994 хранится как 12492).

Причина этого заключается в том, что SAS имеет три отдельных счетчика, которые отслеживают даты и время. Эти счетчики дат начинались с нуля 1 января 1960 года. Следовательно, даты до 1/1/1960 имеют отрицательные значения, а любая дата после имеет положительное значение. Каждый день в полночь счетчик дат увеличивается на единицу.

Одна история гласит, что основатели SAS хотели использовать приблизительную дату рождения системы IBM 370, и они выбрали 1 января 1960 года в качестве легко запоминающегося приближения.

Теперь, когда вы знаете причину, по которой столбец DOJ отображал эти цифры, давайте попробуем решить эту проблему. Для преодоления этой проблемы мы используем формат.

Формат

Informats-это инструкции для чтения данных, в то время как форматы-это инструкции, используемые для отображения или вывода данных. Определение формата переменной-это то, как вы указываете SAS отображать значения в переменной. Форматы группируются в те же три класса, что и информационные (символьные, числовые и дата-время), и всегда содержат точку.

Общая форма заявления формата такова:

  • Формат переменная-имя формат-имя. ;

Давайте вернемся к нашему коду с набором данных Employee_Info, чтобы посмотреть, можем ли мы правильно отобразить дату с помощью команды FORMA T.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

DAT A Employee_Info;

input Emp_I D Emp_Name$ Emp_Vertical$ DOJ;

INFORMA T DOJ ddmmyy10. ;

FORMA T DOJ ddmmyy10. ;

datalines;

101 Mak SQL 18/08/2013

102 Rama SAS 25/06/2015

103 Priya Java 21/02/2010

104 Karthik Excel 19/05/2007

105 Mandeep SAS 11/09/2016

;

Run;

PRO C PRINT DAT A=Employee_Info;

Run;

Мы использовали команду FORMA T в строке № 4 в приведенном выше коде. Следующий экран вывода даст нам желаемый результат.

Формат-Программирование SAS-Edureka

Мы успешно отобразили набор данных с помощью команды формат даты. Я надеюсь, что вы поняли, как использовать формат и Информат. Давайте продолжим наш блог по программированию SAS и рассмотрим еще одну важную концепцию.

Петли SAS

При выполнении программирования SAS мы можем столкнуться с ситуациями, когда нам неоднократно нужно выполнить блок кода несколько раз. Неудобно писать один и тот же набор утверждений снова и снова. Вот где петли вступают в картину. В SAS оператор Do используется для реализации циклов. Он также известен как цикл Do. На рисунке ниже показана общая форма операторов цикла Do в SAS.

Петли в программировании SAS - SAS-EdurekaНиже приведены типы циклов D O в SAS:

  • Индекс: цикл продолжается от начального значения до значения остановки переменной индекса.
  • While: цикл продолжается до тех пор, пока условие While не станет ложным.
  • Until: цикл продолжается до тех пор, пока условие Until не станет истинным.

Сделать индексный цикл

Мы используем переменную индекса в качестве начального и конечного значения для цикла Do Index. Операторы SAS выполняются повторно до тех пор, пока переменная индекса не достигнет своего конечного значения.
Синтаксис:

1

2

3

Do indexvariable = initialvalue to finalvalue;

SAS statements;

End;

Давайте взглянем на пример кода, чтобы понять цикл Do Index. В приведенном ниже коде VAR является индексной переменной.

1

2

3

4

5

6

7

DAT A Sample Loop;

SUM=0;

Do VAR = 1 to 10;

SUM = SUM + VAR;

END;

PRO C PRINT DAT A = Sample Loop;

Run;

При выполнении приведенного выше кода вы получите следующий результат.

SASLoop-Программирование SAS-Edureka

Do While Loop

Цикл Do While использует условие WHILE. Этот цикл выполняет блок кода, когда условие истинно, и продолжает выполнять его, пока условие не станет ложным. Как только условие становится ложным, цикл завершается.

Синтаксис:

1

2

3

Do While (condition);

SAS statements;

End;

Следующий пример кода поможет вам понять цикл D O WHILE.

1

2

3

4

5

6

7

8

9

DAT A Sample Loop;

SUM=0;

VAR=1;

Do While(VAR

SUM = SUM + VAR;

VAR+1;

END;

PRO C PRINT DAT A = Sample Loop;

Run;

Приведенный выше код даст вам следующий результат.

SASLoop-Программирование SAS-Edureka

Делаем Пока Петлю

Цикл Do Until использует условие Until. Этот цикл выполняет блок кода, когда условие ложно, и продолжает выполнять его, пока условие не станет истинным. Как только условие становится истинным, цикл завершается.

Синтаксис:

1

2

3

Do Until (condition);

SAS statements;

END;

Давайте взглянем на пример программы.

Обучение Науке О Данных

1

2

3

4

5

6

7

8

9

DAT A Sample Loop;

SUM=0;

VAR=1;

Do Until(VAR>15);

SUM=SUM+VAR;

VAR+1;

END;

PRO C PRINT;

Run;

Код имеет следующий вывод.

SASLoop4-Программирование SAS - Edureka

Таким образом, мы закончили концепцию циклов в программировании SAS. Все темы, которые мы изучали до сих пор, говорили об основах программирования SAS в целом.

Теперь давайте рассмотрим некоторые статистические процедуры. Эти процедуры станут основой для передовых аналитических процедур.

Подпишитесь на наш канал youtube, чтобы получать новые обновления. . !

Основные статистические процедуры с использованием SAS

PRO C ОЗНАЧАЕ Т

Эта процедура используется для вычисления среднего арифметического и стандартного отклонения. Людям, которые не знакомы со статистикой, может быть трудно понять эти термины. Итак, прежде чем мы начнем кодировать и использовать эту процедуру. Я попытаюсь объяснить, что означают эти термины.

Давайте начнем со среднего арифметического и посмотрим, как PRO C MEANS используется в программировании SAS для его вычисления.

среднеарифметический

Сумма значений числовых переменных, деленная на число переменных, дает среднее арифметическое. Он также известен как средний и является мерой центральной тенденции. Мера центральной тенденции — это единственное значение, которое пытается описать набор данных, определяя центральное положение в этом наборе данных.

В программировании SAS вы используете PRO C MEANS для вычисления среднего арифметического. Эта процедура позволяет найти среднее значение всех переменных или нескольких переменных набора данных. Вы также можете формировать группы и вычислять среднее значение переменных, специфичных для этой группы.

Синтаксис:

1

2

3

PRO C MEANS DAT A = DATASET;

Class Variables ;

Var Variables;

  • Переменные: переменные в приведенном выше синтаксисе указывают переменные из набора данных, среднее значение которых должно быть вычислено.

Среднее Значение Набора Данных

Если указать только имя набора данных без каких-либо переменных, можно вычислить среднее значение всех переменных в наборе данных.

Давайте рассмотрим пример кода. Я рассмотрел заранее определенный набор данных SAS, называемый Следующая команда отобразит набор данных.

1

2

PRO C PRINT data=sashelp. CAR S;

Run;

На рисунке ниже показан вывод приведенного выше кода.

dataset-Программирование SAS-Edureka
Теперь давайте воспользуемся этим кодом набора данных и рассчитаем среднее значение каждой переменной в наборе данных

1

2

PRO C MEANS DAT A = sashelp. CAR S Mean SUM MAXDE C=2;

Run;

На рисунке ниже показано среднее значение всех переменных в наборе данных до двух десятичных знаков.
SAS Mean-Программирование SAS-Edureka

Среднее Значение Выбранных Переменных

Указав имена в опции Var, вы можете получить среднее значение указанных переменных. Пожалуйста, обратитесь к приведенному ниже коду.

1

2

3

PRO C MEANS DAT A = sashelp. CAR S mean SUM MAXDE C=2;

var horsepower cylinders;

Run;

SAS MEAN var-SAS Программирование-Edureka

Среднее Значение По Классу

Вы можете найти среднее значение числовых переменных, организовав их в группы с помощью некоторого параметра для их группировки. Рассмотрим следующий пример кода. Давайте выясним среднее значение лошадиной силы для различных групп, классифицированных по классам

1

2

3

4

PRO C MEANS DAT A = sashelp. CAR S MEANS SUM MAXDE C=2;

class make type;

var horsepower;

Run;

На рисунке ниже показан вывод приведенного выше кода.

SAS Mean-Программирование SAS-Edureka

Давайте продолжим наш блог по программированию SAS и рассмотрим еще одну важную статистическую концепцию.

стандартное отклонение

Стандартное отклонение (S D) — это мера того, насколько разнообразны данные в данном наборе данных. Математически он показывает, насколько близка каждая точка данных к среднему значению набора данных. Если значение стандартного отклонения близко к 0, это указывает на то, что точки данных очень близки к среднему значению набора данных, а высокое стандартное отклонение указывает на то, что точки данных разбросаны по широкому диапазону значений.

В SAS можно вычислить значение стандартного отклонения с помощью двух процедур. Они являются:

  • PRO C ОЗНАЧАЕ Т
  • SURVEYMEANS

Стандартное отклонение с использованием средств PRO C

Вы можете измерить стандартное отклонение с помощью proc means, вы должны выбрать опцию STD на шаге PRO C. Он будет отображать значения стандартного отклонения для каждой числовой переменной в наборе данных.

Синтаксис:

1

PRO C MEANS DAT A = dataset STD;

Рассмотрим этот пример кода, давайте создадим еще один набор данных CAR S1 из набора данных CAR S в библиотеке SASHELP. Для этого мы воспользуемся процедурой PRO C SQL. Сгруппируем данные по ‘типу

1

2

3

4

5

6

7

8

9

10

PRO C SQL;

create table CAR S1 as

SELEC T make, type, horsepower, cylinders, weight

FRO M

SASHELP. CAR S

WHERE make in ('Audi', 'BMW')

;

RUN;

PRO C MEANS DAT A=CAR S1 STD;

Run;

Приведенный выше код даст стандартное отклонение для выбранных переменных. На следующем рисунке показан вывод.

Стандартное отклонение-Программирование SAS-Edureka

PRO C SURVEYMEANS

Эта процедура используется для измерения стандартного отклонения наряду с некоторыми предварительными функциями, такими как измерение стандартного отклонения для категориальных переменных и дисперсии.

Синтаксис:

1

2

3

4

PRO C SURVEYMEANS options statistic-keywords;

By variables;

Class variables;

Var variables;

Ниже приводится описание используемых параметров:

  • By используется для обозначения переменных, используемых для создания групп наблюдений. 
  • Класс указывает переменные, используемые для категориальных переменных.
  • Var указывает переменные, для которых будет рассчитываться SD.

Давайте посмотрим на этот пример кода, который описывает использование параметра класса, который создает статистику для каждого из значений в переменной класса.

1

2

3

4

5

6

7

PRO C SURVEYMEANS DAT A=CAR S1 STD;

Class type;

Var type horsepower;

ods output statistics=rectangle;

Run;

PRO C PRINT DAT A=rectangle;

Run;

На изображениях ниже показан вывод приведенного выше кода. Он показывает распределение данных для переменной (Доверительный интервал означает диапазон значений, определенный таким образом, что существует определенная вероятность того, что значение параметра лежит в его пределах.)

Средства обследования - Программирование SAS-Edureka

Итак, это подводит нас к концу блога SAS programming. Если у вас есть какие-либо сомнения или проблемы с содержанием блога, пожалуйста, оставьте их в разделе комментариев, я решу их как можно скорее и отвечу вам.

Если вы хотите изучить SAS и построить карьеру в области аналитики, то ознакомьтесь с нашим SAS Training & Certification, который поставляется с живым обучением под руководством инструктора и опытом реальных проектов. Этот тренинг поможет вам глубже понять SAS и овладеть различными концепциями языка программирования SAS.

У вас есть к нам вопрос? Пожалуйста, упомяните об этом в разделе комментариев, и мы свяжемся с вами.