OpenAI เปิดตัว “Sora” AI ใหม่สร้างวิดีโอจากการป้อนคำ - Forbes Thailand

OpenAI เปิดตัว “Sora” AI ใหม่สร้างวิดีโอจากการป้อนคำ

ปี 2021 สตาร์ทอัพปัญญาประดิษฐ์ OpenAI เปิดตัว DALL-E โมเดล Generative AI สำหรับสร้างภาพต่างๆ ขึ้นเป็นครั้งแรก ความอัจฉริยะและศักยภาพในการเปลี่ยนคีย์เวิร์ดหรือ “พรอมพ์ (Prompt)” ที่ป้อนเข้าไปเป็นภาพใหม่ เรียกเสียงฮือฮาจากทั่วทั้งวงการเทคโนโลยี แต่นั่นคล้ายเป็นเพียงอารัมภบทเท่านั้น


    ต่อมาในปี 2022 OpenAI ก็ประกาศศักดาด้วย ChatGPT แชทบอตเอไออัจฉริยะที่มาพร้อมความสามารถในการประมวลผลข้อมูลขั้นสูง สามารถวิเคราะห์ แนะนำ หรือกระทั่งพูดคุยกับผู้ใช้งานได้ราวกับผู้เชี่ยวชาญ แม้จะยังคงมีข้อบกพร่องหลายประการ ก็ไม่อาจปฏิเสธว่าการมาถึง ChatGPT เป็นเสมือนการลั่นกลองศึกแห่งสมรภูมิเอไอ เพราะหลังจากนั้นบรรดาบริษัทเทคโนโลยียักษ์ใหญ่ทั่วโลกต่างก็ออกมาเคลื่อนไหวกันแทบจะในทันที ไม่ว่าจะในฐานะพาร์ทเนอร์หรือคู่แข่ง

    สำหรับปี 2024 นี้ OpenAI ก็ยังไม่แผ่ว โดยทำการเปิดตัว Sora โมเดลเอไอสำหรับสร้างวิดีโอซึ่งมีทั้งความ “เสมือนจริง” และ “เปี่ยมด้วยจินตนาการ” จากพรอมพ์สั้นๆ เท่านั้น

    จากข้อมูลบนบล็อกของทางบริษัทที่เผยแพร่เมื่อวันพุธที่ 14 กุมภาพันธ์ที่ผ่านมา Sora สามารถสร้างสรรค์วิดีโอความยาวสูงสุด 60 วินาทีจากการป้อนคำเข้าไป โดยผลลัพธ์ที่ได้คือวิดีโอที่มีทั้งตัวละคร การเคลื่อนไหว และฉากพร้อมรายละเอียด

    ข้อความบนบล็อกอธิบายว่า “โมเดลนี้ไม่ได้เข้าใจเพียงสิ่งที่ผู้ใช้ร้องขอจากพรอมพ์เท่านั้น แต่ยังรู้ว่าสิ่งใดควรปรากฏในโลกทางกายภาพอีกด้วย” ซึ่งเป้าหมายในการฝึกฝนโมเดลนี้ก็เพื่อให้มันสามารถ “ช่วยเหลือผู้คนแก้ปัญหาที่จำเป็นต้องมีการปฏิสัมพันธ์ในโลกจริง”

    “แม้ว่าโมเดลที่สามารถเข้าใจข้อมูลหลายประเภท (Multi-Modal Model) จะไม่ใช่เรื่องใหม่ และโมเดลที่สร้างวิดีโอจากคำจะมีมาก่อนแล้ว แต่ข้อแตกต่างของเจ้าสิ่งนี้คือความยาวและความแม่นยำที่ OpenAI เผยว่า Sora มีพร้อม” Reece Hayden นักวิเคราะห์อาวุโสจากบริษัทวิจัยตลาด ABI Research กล่าว

    Hayden ยังคาดการณ์ว่าโมเดลเอไอประเภทนี้อาจสร้างผลกระทบอย่างใหญ่หลวงต่อตลาดบันเทิงดิจิทัล แม้ตอนนี้พวกมันจะยังคงมีข้อจำกัดอยู่ก็ตาม

    ยกตัวอย่างเช่น วิดีโอเมืองโตเกียวในฤดูหนาวที่มีหิมะ แต่ขณะเดียวกันซากุระก็ผลิดอกสีชมพูบานสะพรั่ง กลีบดอกไม้ปลิดปลิวไปพร้อมกับละอองหิมะ ตัวละครสองตัวเดินจับมือกันบนทางเดินที่ด้านหนึ่งเป็นถนน และอีกด้านเป็นร้านค้า มีตัวประกอบพร้อมสรรพ ฉากอันงดงามนี้เกิดขึ้นจากพลังของ Sora


    กระนั้นหากพิจารณาดีๆ จะพบข้อบกพร่องหลายประการ ไม่ว่าจะใบหน้าของคนที่ไม่สมบูรณ์ มิติของสิ่งของที่ดูแปลกประหลาด หรือสุดปลายทางเดินที่กลับตันเอาเสียดื้อๆ ตลอดจนรายละเอียดมากมายซึ่งยังคงผิดเพี้ยนจากความเป็นจริง

    OpenAI ยอมรับว่า Sora ยังอยู่ระหว่างกระบวนการพัฒนาและมีจุดอ่อนหลายประการที่ต้องปรับปรุงแก้ไข แต่ศักยภาพของ Sora ณ ปัจจุบันก็ถือว่าน่าประทับใจไม่น้อย นอกจากภาพเหมือนจริงราวกับภาพยนตร์แล้ว Sora ยังสามารถสร้างแอนิเมชันสามมิติได้ ซึ่งเมื่อดูเผินๆ ก็ชวนให้นึกถึงผลงานของสตูดิโอดังอย่าง Pixar

    “Sora เรียนรู้เกี่ยวกับเรขาคณิตสามมิติและความต่อเนื่อง” Tim Brooks หนึ่งในนักวิจัยวิทยาศาสตร์ประจำโปรเจ็กต์อธิบาย “เรายังไม่ได้เสริมตรงส่วนนี้เลย มันตกผลึกได้เองจากการรับข้อมูลมากมายเข้าไป”

    ข้อมูล คืออาหารสำหรับการฝึกฝนปัญญาประดิษฐ์ แต่ข้อมูลก็คือหนึ่งในเหตุผลที่หลายคนยังกังขาในเทคโนโลยีนี้เช่นกัน มีการตั้งคำถามว่าเนื้อหาหรือวิดีโอที่ Sora ผลิตออกมามีการละเมิดลิขสิทธิ์ผลงานของผู้อื่นหรือไม่

    Bill Peebles อีกหนึ่งสมาชิกโปรเจ็กต์บอกว่า “ข้อมูลสำหรับฝึกฝนมาจากคอนเทนต์ที่พวกเราซื้อลิขสิทธิ์แล้ว และคอนเทนต์ที่เผยแพร่เป็นสาธารณะ”

    แต่นั่นไม่อาจเปลี่ยนแปลงข้อเท็จจริงที่ว่า มีการฟ้องร้อง OpenAI มากมายหลายคดีในประเด็นเรื่องลิขสิทธิ์ ก่อให้เกิดคำถามว่าคอนเทนต์มีลิขสิทธิ์ “ที่เผยแพร่เป็นสาธารณะ” ถือว่าชอบธรรมสำหรับนำมาใช้ฝึกฝนเอไอไหม

    ไหนจะยังกฎกติกาต่างๆ ที่ผู้คนคาดหวังว่าจะออกมาคล้ายกับกรณีของโมเดลสร้างภาพอย่าง DALL-E 3 อันได้แก่ ห้ามมีความรุนแรง ห้ามลามกอนาจาร ห้ามนำคนจริงมาใช้ และห้ามลอกเลียนสไตล์ของศิลปินคนใด ตลอดจนเรื่องของความปลอดภัยที่ OpenAI ยกให้เป็นประเด็นสำคัญเทียบเท่ากับความซื่อสัตย์โปร่งใส

    OpenAI เผยว่า Sora จะได้รับการทดสอบโดยทีมผู้เชี่ยวชาญด้านความปลอดภัยทางไซเบอร์ เพื่อหาจุดอ่อน ข้อบกพร่อง และความเสี่ยงต่างๆ รวมถึงการคิดหาวิธีการแก้ไขปัญหาเกี่ยวกับข้อมูลเท็จที่อาจเกิดขึ้น ทางทีมงานจะพยายามอย่างสุดความสามารถ แต่สังคมภายนอกก็ต้องเปิดใจยอมรับและปรับตัวเข้ากับเทคโนโลยีนี้ด้วยเช่นกัน


แหล่งที่มา:

OpenAI: Creating video from text

OpenAI will now let you create videos from verbal cues

OpenAI’s Sora Turns AI Prompts Into Photorealistic Videos


เรื่องราวอื่นๆ ที่น่าสนใจ : Nvidia คว้าอันดับ 4 บริษัทมูลค่าสูงที่สุดในโลก อานิสงส์ AI มาแรง ดันดีมานด์ชิปเติบโตมหาศาล

ไม่พลาดบทความและเรื่องราวน่าสนใจอื่นๆ ติดตามเราได้ที่เฟซบุ๊ก Forbes Thailand Magazine