คำที่นิยมใช้บนโซเชียลมีเดีย

คุณเคยสงสัยเกี่ยวกับภาษาที่ใช้ในโซเชียลมีเดียหรือไม่? หรือ woexrds ที่เราใช้ขึ้นอยู่กับลักษณะบุคลิกภาพของเรา? ถ้าคำตอบของคุณคือใช่ แสดงว่าคุณโชคดี

พื้นหลัง

NS ศูนย์จิตวิทยาเชิงบวก จากมหาวิทยาลัยเพนซิลวาเนีย ได้สร้างสิ่งที่เรียกว่า โครงการความเป็นอยู่ที่ดีของโลก (WWBP). โครงการที่น่าตื่นตาตื่นใจนี้กำลังสร้างเทคนิคทางวิทยาศาสตร์โดยการวัดความผาสุกทางจิตใจและสุขภาพกายโดยอิงจากการวิเคราะห์ภาษาในโซเชียลมีเดีย นักวิทยาศาสตร์คอมพิวเตอร์ นักจิตวิทยา และนักสถิติที่ฉลาดที่สุดกำลังรวมหัวกันในกระบวนการทางจิตสังคมที่ส่งผลต่อสุขภาพและความสุข และกำลังสำรวจศักยภาพในการเปลี่ยนวิธีการสำรวจที่มีราคาแพง ในปี 2013 WWBP ได้เผยแพร่ a ศึกษา ชื่อ บุคลิกภาพ เพศ และอายุในภาษาของโซเชียลมีเดีย: แนวทางคำศัพท์แบบเปิด ในการศึกษาที่ใหญ่ที่สุดงานหนึ่งจนถึงปัจจุบัน WWBP ได้วิเคราะห์คำ วลี และหัวข้อกว่า 700 ล้านคำที่รวบรวมจากข้อความบน Facebook ของอาสาสมัคร 75,000 คน ในการวิเคราะห์ข้อความ พวกเขาใช้สองวิธีในการค้นหาคุณลักษณะทางประชากรศาสตร์และจิตวิทยา:

  • การวิเคราะห์ภาษาที่แตกต่าง (DLA): วิธีการที่ออกแบบโดย WWBP เพื่อระบุคุณลักษณะภาษาที่แตกต่างมากที่สุดจากแอตทริบิวต์ที่กำหนด
  • การสอบถามทางภาษาศาสตร์และการนับคำ (LIWC): เครื่องมือยอดนิยมที่ใช้ในจิตวิทยาเพื่อค้นหาวิธีที่ผู้คนใช้คำในชีวิตประจำวัน ข้อมูลนี้สามารถให้ข้อมูลมากมายเกี่ยวกับความเชื่อ ความกลัว รูปแบบการคิด ความสัมพันธ์ทางสังคม และบุคลิกภาพ

ในการศึกษานี้โดยเฉพาะ WWBP ยังให้อาสาสมัครทำแบบทดสอบบุคลิกภาพมาตรฐาน (แบบจำลองปัจจัย 5 ขนาดใหญ่) เพื่อกำหนดคำที่ใช้ในลักษณะบุคลิกภาพบางอย่าง รวมสิ่งเหล่านี้เข้าด้วยกัน และพวกเขาสามารถเชื่อมโยงภาษาโซเชียลมีเดียของบุคลิกภาพ เพศ และอายุด้วยความแม่นยำ 91.9% ตอนนี้ เรามาเริ่มกันเลยดีกว่า และดูว่าพวกเขารวบรวมการอัปเดตสถานะ Facebook และกำหนดแผนภูมิการแสดงภาพได้อย่างไร



ข้อมูล

ชุดข้อมูลทั้งหมดประกอบด้วยการอัปเดตสถานะ Facebook ประมาณ 19 ล้านรายการที่เขียนโดยผู้เข้าร่วมทั้งหมด ทีมงานของ WWBP จำกัดการวิเคราะห์เฉพาะผู้ใช้ Facebook ที่ตรงตามเกณฑ์ 4 ประการ:

  • ต้องระบุภาษาอังกฤษเป็นภาษาหลัก
  • ได้เขียนอย่างน้อย 1,000 คำในการอัพเดทสถานะ status
  • อยู่ภายใต้อายุ 65
  • ระบุเพศ (ชายและหญิง) และอายุ

ภาษาของเพศ:

ภาษาโซเชียลมีเดีย

ฟีเจอร์ภาษาผู้หญิงแสดงอยู่ด้านบนพร้อมฟีเจอร์ภาษาผู้ชายด้านล่าง ส ขนาดของคำ บ่งบอกถึงความแข็งแกร่งของสหสัมพันธ์ NS สี ระบุความถี่สัมพัทธ์ในการใช้งาน ขีดเส้นใต้ (_) เชื่อมต่อคำหลายวลี



  • ผู้หญิง จากการศึกษานี้ (บน) ใช้คำที่แสดงอารมณ์มากขึ้น (เช่น ตื่นเต้น) และเอกพจน์บุรุษที่หนึ่ง และกล่าวถึงกระบวนการทางจิตวิทยาและสังคมที่มากขึ้น (เช่น 'รักคุณ' และ '<3’ –a heart).
  • ป่วย ใช้คำสบถและการอ้างอิงวัตถุมากขึ้น (เช่น 'xbox', 'black ops', 'wishes he')

ภาษาของอายุ:

ภาษาโซเชียลมีเดีย

ดังที่คุณเห็นในรูปที่ 3 ด้านบน มีการเปลี่ยนแปลงเล็กน้อยในหัวข้อที่คืบหน้าจากกลุ่มอายุหนึ่งไปสู่อีกกลุ่มหนึ่ง นอกจากนี้ยังมีความแตกต่างที่ชัดเจนในคำต่างๆ เช่น การใช้คำแสลง อีโมติคอน และอินเทอร์เน็ตพูดใน กลุ่มอายุ 13 ถึง 18 ปี . ใน อายุ 23-29 ปี , คุณสามารถเห็นคู่ อินเทอร์เน็ตพูด หรือหัวข้องาน (เช่น 'ที่ทำงาน', 'งานใหม่') เราเห็น โรงเรียน หัวข้อที่เกี่ยวข้องสำหรับ อายุ 13 ถึง 18 ปี (เช่น 'โรงเรียน', 'การบ้าน', 'เอ่อ') ในขณะที่เราเห็น วิทยาลัย หัวข้อที่เกี่ยวข้องสำหรับ อายุ 19 ถึง 22 ปี (เช่น 'เทอม', 'วิทยาลัย', 'ลงทะเบียน') ในขณะที่คุณก้าวไปสู่ กลุ่มอายุ 30 ถึง 65 ปี , คำที่ใช้จะเน้นไปที่ความมั่นคงทางอารมณ์กับครอบครัวและเพื่อน ๆ มากขึ้น (เช่น 'ลูกสาว', 'ลูกชายของฉัน', 'ลูก ๆ ของฉัน' และ 'เพื่อนใน fb ของฉัน') โดยทั่วไป คุณจะเห็นความก้าวหน้าของโรงเรียน วิทยาลัย การงาน และครอบครัวเมื่อดูหัวข้อหลักในทุกกลุ่มอายุ



ความถี่มาตรฐานของหัวข้อและคำศัพท์ตามอายุ: ภาษาโซเชียลมีเดีย

ใน มะเดื่อ 4A กราฟแสดงความถี่สัมพัทธ์ของหัวข้อที่เลือกสรรมากที่สุดสำหรับแต่ละกลุ่มอายุตามหน้าที่ของอายุ มะเดื่อ 4B ตอกย้ำสมมติฐานนี้โดยนำเสนอรูปแบบที่คล้ายคลึงกันตามหัวข้อทางสังคมอื่น ๆ มะเดื่อ 4C แสดงว่ามีการใช้คำว่า 'เรา' เพิ่มขึ้นหลังจากอายุ 22 ปี ในขณะที่ 'ฉัน' ลดลง สิ่งนี้ชี้ให้เห็นถึงความสำคัญที่เพิ่มขึ้นของมิตรภาพและความสัมพันธ์เมื่ออายุมากขึ้น



ภาษาของบุคลิกภาพ:

นักวิจัยได้ค้นพบว่าภาษาและบุคลิกภาพของเราตรงกันอย่างไร พวกเขาวิเคราะห์คำศัพท์ที่ใช้โดยผู้เข้าร่วมและจัดระเบียบตามบุคลิกภาพของผู้เข้าร่วมแต่ละคน นี่คือการทบทวนอย่างรวดเร็วของปัจจัยด้านบุคลิกภาพ 5 ประการ:

  • Extroversion: อธิบายว่าคุณโต้ตอบกับผู้คนอย่างไร
  • โรคประสาท: คือวิธีที่คุณจัดการกับอารมณ์
  • ความเห็นด้วย: คือความรู้สึกของคุณที่มีต่อผู้อื่น
  • มโนธรรม: อธิบายว่าคุณมีระเบียบและเชื่อถือได้อย่างไร
  • การเปิดกว้าง: คือเมื่อมีคนอยากรู้อยากเห็นและเปิดใจรับประสบการณ์และความรู้ใหม่ ๆ
ภาษาโซเชียลมีเดีย ภาษาโซเชียลมีเดีย

เราจะเห็นที่ด้านบนซ้ายที่หมวดหมู่ที่เกี่ยวข้องกับสังคมเช่น งานสังสรรค์ หัวข้อที่ปรากฏเป็นลักษณะเด่นที่สำคัญสำหรับ คนพาหิรวัฒน์ . นอกจากนี้ ผลลัพธ์ยังชี้ให้เห็นว่า เก็บตัว มีความสนใจในสื่อญี่ปุ่น (เช่น 'อะนิเมะ', 'มังงะ', 'อินเทอร์เน็ต' และอีโมติคอนสไตล์ญี่ปุ่น: ˆ_ˆ) ด้านล่างซ้ายของรูปที่ 5 ด้านบนแสดงให้เห็นว่าผู้คน สูงในโรคประสาท วลีที่กล่าวถึงทั่วไปเช่น 'sick of', 'depressed' และ 'I hate' ด้านล่างขวาแสดงภาษาที่เกี่ยวข้องกับความมั่นคงทางอารมณ์ ( โรคประสาทต่ำ ). โรคประสาทต่ำ แต่ละคนเขียนเกี่ยวกับกิจกรรมทางสังคมที่สนุกสนานที่ส่งเสริมความสามัคคีหรือสร้างสมดุลทางอารมณ์ที่มากขึ้นเช่น 'กีฬา', 'วันหยุด', 'ชายหาด', 'โบสถ์', 'ทีม' และ เวลาของครอบครัว หัวข้อ. ในรูปที่ 6 ด้านล่าง (ล่างขวา) ผู้ที่แสดง ความเปิดต่ำ ใช้คำที่สั้นลงในการอัพเดทสถานะ (เช่น '2day', 'ur', 'every 1') คนที่ เปิดสูง (ล่างซ้าย) ใช้คำสร้างสรรค์ (เช่น 'ศิลปะ', 'จักรวาล', 'ดนตรี', 'การเขียน' และ 'จิตวิญญาณ') คุณอาจไม่ถูกใจสิ่งนี้ แต่ จิตสำนึกต่ำ คน (กลาง - ซ้าย) ใช้คำที่ชัดเจนมากในการอัปเดตในขณะที่ มีสติสัมปชัญญะสูง คน (กลางซ้าย) ใช้วลี (เช่น 'ทำงาน', 'พร้อมสำหรับ' และ 'วันดี') อย่างที่คุณเห็น แพลตฟอร์มโซเชียลมีเดีย เช่น Facebook และ Twitter เป็นแหล่งข้อมูลที่ดีมากสำหรับการศึกษาผู้คน การอัปเดตสถานะและทวีตเป็นเนื้อหาที่แสดงออก เป็นส่วนตัว และมีเนื้อหาเกี่ยวกับอารมณ์ จำบางสิ่ง:



  • โดยทั่วไปแล้ว ภาษานั้นไม่เอนเอียงและเป็นข้อมูลพฤติกรรมที่วัดได้
  • ภาษา Facebook ช่วยให้นักวิจัยสามารถสังเกตบุคคลได้โดยเฉพาะเมื่อพวกเขานำเสนอตัวตนที่แท้จริงสู่โลกออนไลน์

สำหรับวิธีการ

รูปที่ 1



ดังที่คุณเห็นจากรูปที่ 1 ด้านบน DLA ดำเนินการโดย: 1) การแยกคุณลักษณะ: แยกภาษาโดย: (ก) คำและวลี : ลำดับคำ 1 ถึง 3 คำที่พบในสตริงข้อความ อีโมติคอน และคำสองคำขึ้นไปที่สอดคล้องกับวิธีการพูดแบบเดิมๆ (ข) หัวข้อ : วิเคราะห์ข้อความที่ไม่มีป้ายกำกับจำนวนมากโดยอัตโนมัติ 2.) การวิเคราะห์สหสัมพันธ์: กระบวนการเชื่อมโยงคำกับเพศ อายุ และบุคลิกภาพ เนื่องจากพวกเขาพบคำที่มีความสัมพันธ์กันอย่างมีนัยสำคัญหลายพันคำ แผนภูมิการแสดงภาพจึงเป็นกุญแจสำคัญในการทำความเข้าใจงานวิจัยของพวกเขา (ดูรูปที่ 2 ด้านล่าง)

ที่น่าสนใจใช่มั้ย?