شناسایی تأثیرگذاران شبکههای اجتماعی نمونهبرداری شده
شناسایی تأثیرگذارانی که قادر به پخش اطلاعات به افراد زیاد دیگری از یک شبکه اجتماعی هستند، یک روند تحقیقاتی اساسی در زمینه تحقیقات علمی شبکه است. معیارهای مختلفی برای شناسایی تأثیرگذاران پیشنهاد شدهاند و اثربخشی این معیارهای تأثیرگذار برای مواردی که ساختارهای شبکههای اجتماعی بهصورت کامل شناخته شده هستند، مورد ارزیابی قرار گرفته است. با این حال، در عمل به دست آوردن ساختار کامل یک شبکه اجتماعی بسیار دشوار است زیرا ممکن است دادهها گم شده و یا اشتباه باشند و یا اینکه نمونهبرداری لینکها و گرهها از شبکههای اجتماعی بهصورت نادرست انجام شده باشد. در این مقاله ما تأثیرات نمونهبرداری گرهها از یک شبکه اجتماعی بر روی اثربخشی معیارهای مهم در شناسایی تأثیرگذاران را مورد ارزیابی قرار میدهیم. نتایج تجربی ما میدهند که تأثیر منفی نمونهبرداری غیر تصادفی (برای مثال تعداد لبههای نمونه) بر روی شناسایی تأثیرگذاران، بسیار کم است. برای شبکههای رسانه اجتماعی، ما میتوانیم تأثیرگذارانی که تأثیرات آنها قابلمقایسه با موارد شناسایی شده از شبکههای اجتماعی کامل هستند واز طریق نمونهبرداری 10 الی 30 درصدی شبکه به دست میآیند را شناسایی نماییم. علاوه بر این نتایج ما قادر به ارائه بالاترین سودمندی ممکن از نمونهبرداری شبکه در روند شناسایی تأثیرگذاران است. نتایج ما نشان میدهند که برای برخی از شبکهها، گرههایی با تأثیرات بالا را میتوان بهجای کل شبکه اجتماعی از شبکههای اجتماعی نمونهبرداری شده کشف نمود.
کلمات کلیدی: شبکههای اجتماعی، رسانه اجتماعی، رتبهبندی گره، تأثیر، نمونهبرداری شبکه.
Identifying influencers from sampled social networks
Physica A: Statistical Mechanics and its Applications, Volume 507, 1 October 2018, Pages 294-303
Abstract
Identifying influencers who can spread information to many other individuals from a social network is a fundamental research task in the network science research field. Several measures for identifying influencers have been proposed, and the effectiveness of these influence measures has been evaluated for the case where the complete social network structure is known. However, it is difficult in practice to obtain the complete structure of a social network because of missing data, false data, or node/link sampling from the social network. In this paper, we investigate the effects of node sampling from a social network on the effectiveness of influence measures at identifying influencers. Our experimental results show that the negative effect of biased sampling, such as sample edge count, on the identification of influencers is generally small. For social media networks, we can identify influencers whose influence is comparable with that of those identified from the complete social networks by sampling only 10%–30% of the networks. Moreover, our results also suggest the possible benefit of network sampling in the identification of influencers. Our results show that, for some networks, nodes with higher influence can be discovered from sampled social networks than from complete social networks.
Keywords: Social networks, Social media, Node ranking, Influence, Network sampling