ОБ АНАЛИЗЕ СОЦИАЛЬНЫХ СЕТЕЙ И ИХ МЕТРИКАХ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ОБ АНАЛИЗЕ СОЦИАЛЬНЫХ СЕТЕЙ И ИХ МЕТРИКАХ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
1 Введение

В последнее десятилетие, использование социальных сайтов в повседневной жизни каждого человека все больше и больше набирает популярность. Люди могут общаться на веб-сайтах социальных сетей, таких как Facebook, Twitter, Vkontakte, Instagram и делиться своими знаниями, опытом со своими знакомыми друзьями, родственниками.

Пользователи социальных сетей явным образом раскрывают свои отношения с другими людьми. Как следствие, социальные сети являются полным (почти) отражением отношений, которые существуют в реальном мире. Мы знаем кто вы, ваши хобби и интересы, на ком вы женаты, сколько у вас детей, ваши друзья, коллеги с которыми вы работаете каждую неделю и т.д. Все это взаимосвязанная сеть людей, которая является чрезвычайно интересным источником информации и знаний.

Социальные сети являются важным элементом в анализе мошенничества. Часто, мошеннические действия совершаются через социальные сети с большим количеством соучастников. Когда традиционные методы анализа не в состоянии обнаружить мошенничество в связи с отсутствием доказательств, анализ социальных сетей может дать новые идеи, исследуя, как люди влияют друг на друга. Например, страховым компаниям часто приходится иметь дело с группами мошенников, которые представили ту же претензию с использованием разных людей. Подозрительные требования часто включают одних и тех же претендентов, транспортные средства, свидетелей и так далее. Путем создания и анализа подходящей сети, инспекторы могли бы получить новые идеи в подозрительности иска и предотвратить преследование претензии.

Анализ социальных сетей (social network analysis, SNA) — направление, которое занимается описанием и анализом возникающих в ходе социального взаимодействия и коммуникации связей (сетей) различной плотности и интенсивности. Различные меры SNA используется для представления взаимодействия между участниками, рассматривая сильные или слабые связи, определения ключевых/центральных игроков и подгруппы в сети. При анализе социальных сетей внимание уделяется связям, а не самим действующим лицам. Социальная сеть описывается графом или матрицей взаимоотношений.

Математический аппарат, используемый для анализа, позволяет изучать с помощью взаимосвязанных данных и переменных свойства связей и отношений. Кроме того, с его помощью возможно параллельно исследовать данные разного уровня: поведение отдельных участников, различных подгрупп, особенности позиций в общности и свойства сети в целом.

2 Методология

Freeman [1] предложил три различных интуитивных понятий центральности, а именно: степени, близость, промежуточная центральность, которые в основном используются для определения ключевых игроков в социальной сети. Bonacich [2] [3] предложил собственный вектор центральности для нахождения относительного значения узла, который используется для определения влияния узла на соседние узлы. Everett и др. [4] в своей работе, расширили меры центральности такие как: степень, близость и промежуточность с целью применения их к группам и классам, а также физическим лицам. UCINET - инструмент для анализа социальных сетей был выпущен Everett и др. [5] с большинством количеством необходимых метрик SNA для анализа данных.

Анализ социальных сетей представляет собой специальную методологию и набор способов исследования, позволяющих изучать в формализованном виде связи между участниками социальных сетей. На рисунке 2.1 представлен пример сети. Где белым цветом отмечены законные узлы и черным мошеннические.

В этом разделе мы рассмотрим основные показатели для оценки влияния социальной среды на узлы, представляющие интерес. В общем случае, мы рассмотрим три типа методов анализа:

Рисунок 2.1 – пример сети

  1. Метрики соседства (Neighborhood metrics)

Метрики соседства характеризуют интересующую цель, базируясь на ее прямых партнерах. То есть, узел и его непосредственные контакты. Проще говоря, окрестность – это набор точек, содержащих эту точку.

Показатели включают в себя степень соседства, треугольники, плотность, родственность соседа, и вероятность родства с соседом.

  1.  
    1. Степень (Degree)

Степень [6] узла показывает сколько соседей имеет данный узел. Количество узлов, связанных с данным узлом – это степень данного узла. Часто, бывает, необходимо провести различие между количеством мошеннических и законных связей.

Степень определяется как суммарное количество связей, которые имеют данный узел. Причем степень может быть, как мошенническая (т.е. количество связей с мошенническими/террористическими узлами), так и законной (т.е. число связей с легитимными узлами).

Вычислим степень каждого узла для сети на рисунке 2.1. Результаты показаны в таблице 2.1.

Узел

A

 

C

D

E

F

G

H

I

J

Общая степень

6

3

1

4

2

3

4

2

4

1

Мошенническая степень

1

1

0

2

2

2

3

0

0

0

Законная степень

5

2

1

2

0

1

1

2

4

1

Узел

K

L

M

 

O

 

Q

R

 

T

Общая степень

3

2

2

3

3

1

3

1

1

1

Мошенническая степень

1

0

0

1

0

0

0

0

0

0

Законная степень

2

2

2

2

3

1

3

1

1

1

Таблица 2.1 – общие, законные и мошеннические степени.

Из таблицы видно, что узел A имеет самую высокую степень в сети. Причем узел А имеет связи с 5 законными узлами и 1 мошенническим. Это мошеннические и легитимные (законные) степени.

  1.  
    1. Треугольники (Triangles)

Треугольником [6] в сети является подграф, состоящий из трех узлов, которые связаны друг с другом. Данный метод показывает влиятельный эффект тесно связанных групп узлов. Узлы, которые входят в состав группы (треугольника), зависят от убеждений, интересов, мнений, и так далее из этой группы.

  1.  
    1. Плотность (Density)

Другая метрика соседства – плотность сети [6]. Плотность измеряет степень, в которой узлы сети соединяются друг с другом. Плотность - это количество ребер графа к максимально возможному количеству ребер в графе.

Она вычисляется по формуле.

Где M и N число ребер и узлов в сети соответственно.

Вычислим плотность каждого узла для сети на рисунке 2.1, результат показан в таблице 2.2.

Узел

A

 

C

D

E

F

G

H

I

J

Плотность

0.33

0.5

1

0.6

1

0.83

0.6

0.66

0.5

1

Узел

K

L

M

 

O

 

Q

R

 

T

Плотность

0.5

1

1

0.66

0.5

1

0.5

1

1

1

Таблица 2.2 – плотность каждого узла в сети

Высокая плотность может соответствовать интенсивному потоку информации между узлами, что может свидетельствовать о том, что узлы широко влияют друг на друга. Это может иметь важное значение при анализе мошенничества.

  1.  
    1. Реляционный классификатор (Relational Neighbor Classifier)

Relational Neighbor Classifier [6] использует предположение, в котором говорится, что узлы имеют склонность принадлежать к одному и тому же классу. Если два узла связаны, они как правило, демонстрируют аналогичное поведение. Апостериорная вероятность класса для узла N, который принадлежит к классу С вычисляется следующим образом:

Где представляет собой окрестность узла n, w (n, ) - вес связи между n и и Z представляет собой коэффициент нормализации, чтобы убедиться, что все вероятности в сумме дают единицу.

Рассмотрим пример сети, изображенный на рисунке 2.2, где F и NF представляют собой мошеннические и не мошеннические узлы соответственно.

Рисунок 2.2 – схема сети

Попробуем вычислить реляционный классификатор для центрального узла сети.

Поскольку обе вероятности необходимо подводить к 1, Z равна 5, так что вероятности становятся:

Таким образом, центральный узел является мошенническим с вероятностью 2/5 = 0,4 или 40%, и законным с вероятностью 3/5 = 0,6 или 60%.

Определим Relational Neighbor Classifier для графа на рисунке 2.1. Результаты приведены в таблице 2.3.

Узел

A

 

C

D

E

F

G

H

I

J

P(NF|?)

0.80

0.66

1

0.50

0

0.33

0.25

1

1

1

P(F|?)

0.20

0.33

0

0.50

1

0.66

0.75

0

0

0

Узел

K

L

M

 

O

 

Q

R

 

T

P(NF|?)

0.66

1

1

0.66

1

1

1

1

1

1

P(F|?)

0.33

0

0

0.33

0

0

0

0

0

0

Таблица 2.3 – демонстрация Relational Neighbor

Высокое значение Relational Neighbor Classifier указывает на высокую вероятность того, что узел является мошенническим.

  1.  
    1. Вероятностный реляционный классификатор (Probabilistic Relational Neighbor Classifier)

Вероятностный реляционный классификатор [6] является простым расширением реляционного классификатора, где апостериорная вероятность класса для N-ого узла, который принадлежит классу C рассчитывается следующим образом:

Обратите внимание, что суммирование выполняется по всей окрестности узлов. Вероятности Р может быть результатом локальной модели, или предварительно нанесенной сетевой модели. Рассмотрим схему на рис 2.3.

Рисунок 2.3 – схема сети

Расчеты принимают следующий вид:

Так как обе вероятности необходимо подводить к 1, Z равна 5, так что вероятности становятся:

Таким образом, центральный узел является мошенническим с вероятностью 0,45 или 45%, и законным с вероятностью 0,55 или 55%.

По аналогии с реляционным классификатором, вероятности, возвращаемые вероятностным реляционным классификатором, могут быть использованы в качестве дополнительных переменных в локальных моделях или в качестве классификатора.

  1. Метрики центральности (Centrality metrics)

Метрики центральности — это количественная оценка того или иного лица в социальной сети. Мера центральности описывает выдающееся положение конкретного узла по сравнению с другими узлами. Средняя мера центральности также известна как централизованная оценка, она указывает, насколько плотен граф по отношению к каждому узлу. Центральные метрики, как правило, вычисляются на основании всей структуры сети или подграфа. Мы рассмотрим геодезические пути, промежуточность, близость, и теоретический центр графа.

  1.  
    1. Степень центральности (Degree Centrality)

Степень центральности [1] определяется как число прямых связей или соединений с узлом. Узел с более высоким значением степени центральности часто рассматривается как центр и активный субъект в сети. В террористических и преступных сетях, указывает на то, что узел является «властным»; это такой тип человека или сайта, который может быстро распространить информацию среди других людей. Не обязательно, что узел с самой высокой степенью центральности является лидером в сети. Вообще социальная сеть G представляется в виде матрицы смежности А.

Степень центральности i-ого узла в сети может быть определена как

Где 𝐴(𝑖,𝑗) это элемент в матрице смежности А в [i,j] положении. N – общее количество узлов в сети. (N-1) является коэффициентом нормализации.

  1.  
    1. Геодезический путь (Geodesic Path)

Геодезический путь или кратчайший путь определяет минимальное расстояние между двумя узлами в сети. Ключевой вопрос в мошенничестве: на какое расстояние удалены мошеннические узлы в сети от целевого узла? Если мошеннический узел находится в близком соседстве, мошенничество может оказать влияние на этот узел.

Дейкстра (1959) сформулировал решение для вычисления кратчайшего пути от одного узла ко всем другим. Заметим, что алгоритм Дейкстры применим только к сетям с неотрицательными весами ребер.

Для сети на рисунке 2.1, таблица 2.4 содержит геодезический путь каждого узла к мошенническим узлам, а также количество прыжков в сторону мошеннических узлов. Теоретический центр графа на рисунке 2.1 это узел А, который наиболее удален ото всех других узлов в сети, это значит, что узел А это наиболее влиятельный узел сети. В случае, если центральный узел сети подвержен мошенничеству, оно может быстро распространиться по всей остальной части сети.

Узел

A

 

C

D

E

F

G

H

I

J

Геодезический путь

1

1

2

0

0

0

1

2

0

2

1-ый прыжок

1

1

0

2

2

2

3

0

0

0

2-ой прыжок

4

3

1

8

4

7

5

2

6

1

3-ий прыжок

18

13

3

19

15

17

25

4

9

0

Узел

K

L

M

 

O

 

Q

R

 

T

Геодезический путь

1

2

2

1

2

3

3

4

4

2

1-ый прыжок

1

0

0

1

0

0

0

0

0

1

2-ой прыжок

0

1

1

0

1

0

0

0

0

1

3-ий прыжок

9

1

1

8

4

1

1

0

0

4

Таблица 2.4 – демонстрация геодезических путей

  1.  
    1. Близость (Closeness centrality)

Центральность по близости [1] выражает, насколько близко узел расположен к остальным узлам сети. Центральность по близости (Closeness centrality) является показателем того, насколько быстро распространяется информация в сети от одного узла к другим, то есть насколько близок рассматриваемый узел ко всем остальным узлам сети.

Суть его состоит в том, чтобы оценить насколько близок рассматриваемый узел ко всем остальным участникам (узлам) сети. Для того чтобы иметь высокую степень данного вида центральности, узел должен не просто обладать множеством связей. Важно, чтобы у его соседей их тоже было достаточно. Это означает, что узел с высокой степенью центральности по близости через те связи, в которые он включен, получает возможность доступа к большому количеству других участников сети, распространяя свое влияние на них.

Она может быть определена как среднее значение длины всех кратчайших путей между узлом и всеми остальными узлами в сети. Узел с высоким значением близости может быстро получить доступ к остальным узлам в сети.

Близость по центральности i-ого узла в сети может быть определена следующим образом

Где 𝑑(𝑖𝑗) расстояние или длина пути между двумя узлами I и J.

Определим близость для каждого узла для сети на рисунке 2.1. Результаты показаны в таблице 2.5.

Узел

A

 

C

D

E

F

G

H

I

J

Близость

0.50

0.39

0.28

0.35

0.26

0.33

0.43

0.37

0.45

0.26

Узел

K

L

M

 

O

 

Q

R

 

T

Близость

0.34

0.26

0.26

0.34

0.40

0.29

0.31

0.24

0.24

0.34

Таблица 2.5 – значения близости для каждого узла

Как видно из расчетов, узел A имеет самое высокое значение близости. В этом случае узел A, имеющий в среднем более короткую дистанцию до других участников сети, может наиболее эффективно передавать и получать информацию.

  1.  
    1. Промежуточность (Betweenness Centrality)

Промежуточность [1] является мерой для идентификации узлов, которые действуют в качестве моста для соединения с другими группами или сообществами в сети. Она может быть определена как количество кратчайших путей между любой парой, которые проходят через узел. Узел с высоким значением промежуточности рассматривается как мощный узел с большим количеством влияния.

В террористических и преступных сетях помогает в поиске человека, который может быть потенциальным брокером (человек, имеющий максимум информации) между двумя группами или сообществами в этой сети. В частности, это изображено на рисунке 2.4. На рисунке заштрихованный узел соединяет три сообщества друг с другом и имеет самую высокую промежуточность.

Промежуточность узла в сети может быть определена следующим образом:

Где 𝑔𝑗𝑘 это общие кратчайшие пути между двумя узлами j и k, и 𝑔𝑗𝑘 (𝑖) это общие кратчайшие пути между j и k, которые проходят через i узел. Для нормализации значений используются коэффициенты (N-1) (N-2).

Определим промежуточность каждого узла для сети на рисунке 2.1. Результаты расчетов приведены в таблице 2.6.

Узел

A

 

C

D

E

F

G

H

I

J

Промежуточность

104

24.67

0

13.83

0

6.167

35.33

9

65

0

Узел

K

L

M

 

O

 

Q

R

 

T

Промежуточность

20

0

0

34

63

0

35

0

0

0

Таблица 2.6 – значения близости для каждого узла

Если у какого-либо узла высокий показатель промежуточности, можно предположить, что он – единственная связь между различными частями сети. В данном случае самое высокое значение имеет узел А, который может выступать в качестве моста, между несколькими частями сети.

Рисунок 2.4 - Иллюстрация промежуточности между сообществами узлов

  1.  
    1. Теоретический центр графа (Graph theoretic center)

Теоретический центр графа - это узел с наименьшим, максимальным расстоянием до всех остальных узлов, это самый центральный узел в сети. С точки зрения распространения информации, теоретический центр графа - это узел, который влияет на остальные узлы быстрее.

  1. Алгоритмы коллективного вывода (Collective Inference algorithms). Групповые показатели центральности.

Принимая во внимание сеть с известным количеством мошеннических и законных связей, мы можем использовать эти знания с целью определения вероятности мошенничества для всех неизвестных узлов. В отличие от метрик соседства и центральных метрик, алгоритмы коллективного вывода [6] определяют вероятность того, что узел подвергается мошенничеству и вероятность того, что мошенничество влияет на определенный узел.

Они имеют три характеристики:

  • Связанные экземпляры (Related instances): экземпляры, которые должны быть (например, веб-страницы, сообщения электронной почты) явно или неявно связаны между собой.

  • Классификатор (Classifier): для классификации экземпляра (например, веб-страницы), базовый классификатор использует нереляционные функции (например, слова в странице) и реляционные функции (например, наиболее распространенные метки класса среди других страниц, связанных с текущей). Классификаторы, которые были использованы для этой цели: сети Байеса, сети Маркова и логистическая регрессия.

  • Коллективный вывод (Collective inference): алгоритм коллективного вывода используется для обновления меток класса (или условных вероятностей), которые затем используются для пересчета реляционных значений-признаков.

  1.  
    1. Алгоритм PageRank

Алгоритм PageRank [10] разработан Пейджем и Брином в 1999 году и лежит в основе известного алгоритма поисковой системы Google для ранжирования веб-страниц. Это поисковый алгоритм ранжирования с использованием гиперссылок в Интернете. Зависит от числа внешних ссылок на данную страницу и от их веса.

PageRank это показатель важности и ранжирования узлов в социальной сети. Используя PageRank для анализа террористических и мошеннических сетей, значимость (важность) узла может быть определена на основе его положения в сети.

PageRank узла 𝑎 в сети может быть определена следующим образом:

Где 𝑁𝑏𝑎 - узлы, подключенные к узлу 𝑎 и 𝐿(𝑏) является общими ссылками, исходящие к узлу b. 𝑃𝑅(𝑏) это PageRank от узла b.

Для сети на рисунке 2.1 попробуем применить алгоритм PageRank. Результат работы алгоритма показан в таблице 2.7.

Узел

A

 

C

D

E

 

0.1084

0.0577

0.0238

0.0684

0.0367

 

0.0877

0.0635

0.0180

0.1685

0.1144

Узел

F

G

H

I

J

 

0.0519

0.0671

0.0400

0.0706

0.0246

 

0.1452

0.1094

0.0236

0.0941

0.0112

Узел

K

L

M

 

O

 

0.0604

0.0415

0.0415

0.0578

0.0667

 

0.0396

0.0169

0.0169

0.0344

0.0206

Узел

 

Q

R

 

T

 

0.0264

0.0755

0.0289

0.0289

0.0229

 

0.0058

0.0112

0.0032

0.0032

0.0124

Таблица 2.7 – демонстрация работы PageRank

PageRank для оценки примера на рисунке 2.1 вычисляется, не выделяя мошеннические метки () и с акцентом на мошенничество (). Самый высокий рейтинг присваивается узлу А при применении , поскольку узел А имеет самую высокую степень в сети. И далее, при применении узлы с наивысшим рейтингом – это узлы D, F, E. Это не удивительно, так как эти узлы изначально были определены как мошеннические. Обратите внимание на то, что законный узел G имеет более высокий рейтинг, чем мошеннический узел I. Узел G получает высокий рейтинг мошенничества, что указывает на то, что этот узел зависит от влияния мошеннических узлов в его окрестности.

  1.  
    1. Выборки Гиббса (Gibbs sampling)

Выборки Гиббса [6] представляют собой процедуру коллективного вывода, которая использует локальный классификатор для определения апостериорной вероятности класса для инициализации меток узлов в сети.

Социальные сети насчитывают сотни тысяч узлов причем их количество постоянно меняется. Поэтому необходимы алгоритмы, работающие не с фиксированным набором данных, а с данными, обновляющимися в режиме реального времени. Стандартные методы могут не подходить для задачи поиска узлов в режиме реального времени, потому что при появлении в сети нового узла нужно полностью пересчитывать все параметры сети.

Запускается итерационный процесс, на каждом шаге которого обрабатываются только данные из соответствующей порции и вычисляется оптимальный параметр постулируемого апостериорного распределения, задаваемого вариационным алгоритмом. После каждого шага этот параметр обновляется с учетом значения, вычисленного на предыдущей порции. Как правило, параметр вычисляется как взвешенное среднее текущего и предыдущего значений.

Сэмплирование по Гиббсу удобно тем, что для него не требуется явно выраженное совместное распределение, а нужны лишь условные вероятности для каждой переменной, входящей в распределение. Алгоритм на каждом шаге берет одну случайную величину и выбирает ее значение при условии фиксированных остальных.

3 Методы сбора данных

3.1 Сбор данных из онлайновых социальных сетей

Сбор данных из онлайновых социальных сетей включают в себя извлечение разнообразных пользовательских данных, такие как: группы и страницы, которые содержат сообщения, репосты, комментарии, фотографии, видео и т.д. Наиболее известные и популярные социальные сети Facebook, Twitter, YouTube предоставляют ряд инструментов и API-интерфейсы для извлечения данных из своих сетей. Facebook API, Twitter API, Netvizz [7] и NodeXL [12] представляют собой инструменты для извлечения данных из социальных сетей и их дальнейшего анализа.

3.2 Сбор данных из оффлайновых социальных сетей

Сбор данных для автономного анализа социальных сетей включает в себя государственные и открытые данные из разнообразных новостных статей, отчетов, записей телефонных звонков, текстовый анализ и т.д. Для автономного анализа террористических и преступных сетей, существует такие базы данных как GTD [8] и GDELT [9].

4 Сравнение инструментов для анализа сетей.

Инструмент

Функциональность

Платформа

Тип лицензии

Gephi [11]

Анализ социальных сетей и визуализация, различные макеты для визуализации, различные меры центральности, кластеризация и модульность, ранжирование и разделение сети, функция Timeline, поддержка плагинов.

Windows, Linux

Open-source

Wobot Monitor

Инструмент для мониторинга социальных медиа, который дает доступ к таким статистическим данным, как количество авторов, ресурсов, показателям охвата и вовлеченности, вычисляет лидеров мнений и т.д. Wobot работает в том числе и с социальной сетью ВКонтакте.

Windows, Linux

Проприетарная

YouScan

Инструмент для мониторинга русскоязычных социальных медиа. YouScan отслеживает упоминания брендов, продуктов, конкурентов в блогах, форумах и социальных сетях ВКонтакте, Twitter и YouTube, а также представляет результаты мониторинга в аналитическом интерфейсе с функциями командной работы.

Windows, Linux

Проприетарная

NodeXL [12]

Шаблон для MS Excel, визуализация и анализ сетей, импорт данных непосредственно из нескольких онлайновых социальных сетей, экспорт данных в различные форматы, макеты визуализации, меры для анализа.

Windows

Open-source

5 Выводы и заключение

SNA можно рассматривать в качестве одного из мощного инструмента для анализа террористических и преступных сетей. Различные алгоритмы SNA такие как: метрики соседства, метрики центральности, обнаружение сообществ являются очень эффективными для нахождения ключевых игроков или лидера, их модель общения, а затем разработки стратегии для срыва террористических планов. Эти меры очень полезны при скрытом анализе децентрализованной и крупной террористической сети. Но также существуют и проблемы, связанные со сбором данных и анализом террористических сетей. Сбор данных для террористических сетей очень сложен и трудоемок для исследователей, поскольку этот процесс строго конфиденциален. Большая часть данных имеет тенденцию быть неполной и с большим количеством отсутствующих или поддельных узлов и отношений, что часто приводит к неправильному результату анализа такой террористической сети. Кроме того, террористические сети в значительной степени децентрализованы и имеют динамичный характер с постоянно меняющимися узлами и их связями. В случае онлайн-анализа социальной сети конфиденциальность личности при сканировании персональных данных также весьма острый вопрос.

Учитывая эти проблемы и ограничения, будущие исследования предполагают более эффективные и надежные методы сбора данных в таких сетях. Кроме того, необходимо изучить такие проблемы как: обнаружение подмены узлов, а также поддельные узлы и связи. Для обработки террористических сетей, имеющих динамичный характер, рекомендуется проводить анализ с использованием подхода, основанного на временной шкале. Интеллектуальный анализ данных и широкий набор инструментов могут быть интегрированы с существующими методами для анализа динамично изменяющейся сети.

Принимая во внимание все вышесказанное, мы можем извлечь из сети указанные показатели для каждого узла, представляющего для нас интерес. Данный процесс влечет за собой отображение неструктурированного источника данных, например, полезные и значимые характеристики каждого узла. Хотя большинство функций уже дают хорошее представление, какие узлы могут носить мошеннический характер в будущем, эти сетевые характеристики могут быть объединены с локальными (или внутренними) функциями в модели классификации.

5 Библиографическийсписок

[1] Freeman, Linton C., (1979) "Centrality in social networks conceptual clarification", Social networks, Vol. 1, No. 3, pp215-239.

[2] Bonacich, Phillip, (1972) "Factoring and weighting approaches to status scores and clique identification", Journal of Mathematical Sociology, Vol. 2, No.1, pp113-120.

[3] Bonacich, Phillip, (1987) "Power and centrality: A family of measures", American Journal of Sociology, pp1170-1182.

[4] Everett, Martin G., & Stephen P. Borgatti, (1999) "The centrality of groups and classes", The Journal of mathematical sociology, Vol. 23, No.3, pp181-201.

[5] Borgatti, Stephen P., Martin G. Everett, & Linton C. Freeman, (2002) "Ucinet for Windows: Software for social network analysis".

[6] Baesens, Bart., (2015) "Fraud analytics using descriptive, predictive, and social network techniques: a guide to data science for fraud detection", pp207-277.

[7] Rieder, B., (2013) “Studying Facebook via data extraction: the Netvizz application”, 5th Annual ACM Web Science Conference, pp346-355.

[8] LaFree, Gary, and Laura Dugan, (2007) "Introducing the global terrorism database", Terrorism and Political Violence, Vol. 19, No. 2, pp181-204.

[9] Leetaru, Kalev, and Philip A. Schrodt, (2013) "GDELT: Global data on events, location, and tone, 1979–2012", ISA Annual Convention, Vol. 2.

[10] Page, L., Brin, S., Motwani, R., & Winograd, T., (1999). “The PageRank citation ranking: Bringing order to the web”. Stanford Digital Library Project.

[11] Bastian, M., Heymann, S., & Jacomy, M., (2009) “Gephi: an open source software for exploring and manipulating networks”. ICWSM, 8, 361-362.

[12] Smith, M., Milic-Frayling, N., Shneiderman, B., Mendes Rodrigues, E., Leskovec, J., & Dunne, C., (2010) “NodeXL: a free and open network overview, discovery and exploration add-in for Excel 2007/2010”, Social Media Research Foundation.

Просмотров работы: 784