ไปใหญ่หรือกลับบ้าน

ไปใหญ่หรือกลับบ้าน

สารปนเปื้อนที่ทำให้สับสนการติดตามการเปลี่ยนแปลงของจุลชีพในทารก นักวิจัยคิดว่าพวกเขาได้พบรูปแบบที่เกี่ยวข้องกับอายุในเดือน (บนสุด) แต่รูปแบบที่มีลักษณะเฉพาะของแบคทีเรีย (กลาง) นั้นเกิดจากการปนเปื้อนในสองชุดที่ใช้สกัด DNA (ชุดที่ 1 และ 2) แบบไม่มีสิ่งเจือปนหายไป (ด้านล่าง)MacArthur และนักวิทยาศาสตร์คนอื่นๆ ใน Exome Aggregation Consortium กำลังพยายามติดตามการกลายพันธุ์ที่หายากมากซึ่งเป็นสาเหตุของโรค MacArthur มุ่งเน้นไปที่โรคของกล้ามเนื้อ เช่น โรคกล้ามเนื้อเสื่อมและโรคกล้ามเนื้อพิการแต่กำเนิด

เขาและเพื่อนร่วมงานต้องค้นหา DNA ประมาณ 30 ล้าน

เบสที่ประกอบเป็น exome ของคนๆ หนึ่งเพื่อค้นหาการกลายพันธุ์หนึ่งหรือสองครั้งที่ทำให้เกิดโรค งานนั้นอาจจะยากพอแต่ก็ยังซับซ้อนกว่านั้นอีก เพราะแม้แต่จีโนมของคนที่มีสุขภาพดีก็ยังมีความหลากหลายทางพันธุกรรมประมาณ 20,000 ถึง 30,000 สายพันธุ์ นักวิทยาศาสตร์สามารถบอกได้อย่างไรว่าสิ่งที่พวกเขาค้นพบเป็นการกลายพันธุ์ที่ก่อให้เกิดโรคจริง ๆ และไม่ใช่รูปแบบที่หายากที่ไม่เป็นพิษเป็นภัย บ่อยครั้งพวกเขาทำไม่ได้

การศึกษาที่ตีพิมพ์ในScience Translational Medicineในปี 2554 พบว่า27 เปอร์เซ็นต์ของตัวแปรที่ระบุว่าเป็นสาเหตุของโรคที่หายากที่สืบทอดมานั้นกลายเป็นเรื่องธรรมดาหรือถูกติดฉลากผิด สำหรับ MacArthur ความหมายนั้นชัดเจน: “พวกเราทุกคนที่ค้นพบโรคที่หายากในทศวรรษที่ผ่านมามีผู้ป่วยที่วินิจฉัยผิดเกือบอย่างแน่นอน”

ทางออกของปัญหา? ไปใหญ่. MacArthur และเพื่อนร่วมงานตระหนักว่าการรวมข้อมูลจากผู้คนจำนวนมากใน Exome Aggregation Consortium จะช่วยให้พวกเขาเห็นภาพที่ดีขึ้นว่าตัวแปรทั่วไปในประชากรเป็นอย่างไร ด้วยความรู้ดังกล่าว นักวิจัยสามารถมั่นใจมากขึ้นว่าการกลายพันธุ์ที่พวกเขาค้นพบนั้นหายากจริงๆ และเป็นสาเหตุของโรค

MacArthur กล่าวว่า “ผลกระทบของข้อมูลขนาดใหญ่ที่มีต่อวิทยาศาสตร์

นั้นเป็นแรงผลักดันให้เกิดผลดีอย่างไม่ต้องสงสัย “มันกวาดล้างผลบวกที่ผิดพลาดออกไป”

 แต่การสร้างฐานข้อมูลไม่ใช่เรื่องง่าย MacArthur กล่าวว่าแต่ละโปรเจ็กต์ที่ให้ข้อมูลนั้นสร้างความแตกต่าง เขาและคนอื่นๆ ใช้เวลาเกือบสองปีในการพัฒนาซอฟต์แวร์เพื่อประสานข้อมูลจากแหล่งที่แตกต่างกัน

 ข้อมูลยุ่ง

การแบ่งปันข้อมูลขนาดใหญ่เป็นการทดสอบที่ทุกคนคุ้นเคยกันดีสำหรับ Santiago Pujol วิศวกรโยธาที่มหาวิทยาลัย Purdue ในเมือง West Lafayette รัฐ Ind. Pujol และเพื่อนร่วมงานกำลังสร้างแพลตฟอร์มเสมือนจริงเพื่อให้มีห้องปฏิบัติการ 15 แห่งที่เกี่ยวข้องกับโครงการวิศวกรรมแผ่นดินไหวที่สนับสนุนโดย National Science มูลนิธิในการจัดเก็บและแบ่งปันข้อมูลของพวกเขา

“สิ่งที่เราได้รับนั้นค่อนข้างท้าทาย” ปูโจลกล่าว บางครั้งไฟล์ข้อมูลจะมาถึงโดยไม่มีคำอธิบายเกี่ยวกับประเภทของข้อมูลที่อยู่ในนั้น หรือการวัดจะถูกติดป้ายกำกับแต่ไม่รวมหน่วย “คุณไม่รู้ว่าพวกมันวัดเป็นมิลลิเมตรหรือนิ้ว” Pujol กล่าว ในระยะสั้นมันเป็นระเบียบ

ประสบการณ์ของปูโจลไม่ใช่เรื่องแปลก สำหรับ MBQC นั้น Huttenhower คิดว่าเขาได้ให้คำแนะนำที่แม่นยำแก่นักวิจัยเกี่ยวกับไมโครไบโอมในการนำเสนอข้อมูลลำดับไปยังห้องปฏิบัติการวิเคราะห์ แต่เขาบอกว่าเขายังมีประเภทไฟล์และรูปแบบข้อมูลที่หลากหลายซึ่งต้องกระทบยอดก่อนที่โปรแกรมคอมพิวเตอร์จะวิเคราะห์ได้ พวกเขา.

Pujol และคนอื่นๆ กล่าวว่ามาตรฐานสำหรับการนำเสนอและการจัดเก็บข้อมูลสามารถช่วยให้การวิจัยทุกประเภทมีความน่าเชื่อถือมากขึ้น

credit : webseconomicas.net yukveesyatasinir.com disabilitylisteningtour.com hollandtalkies.com somersetacademypompano.com kleinerhase.com lagauledechoisyleroi.net halkmutfagi.com alriksyweather.net jimwilkenministries.org