Giới thiệu về single cell RNA-seq

1. Đặc điểm chính của Bulk RNA-seq và single cell RNA-seq

a. Bulk RNA-seq

Đo biểu hiện trung bình của một gene trong một tập hợp tế bào
Hữu dụng trong so sánh hệ phiên mã và định lượng gene biểu hiện đặc hiệu (Ví dụ: so sánh hệ phiên mã của mô gan từ chuột lành và chuột mang bệnh để đánh giá mức độ tăng giảm biểu hiện của gene)
Không phù hợp trong nghiên cứu những hệ thống mang tính không đồng nhất (Ví dụ: so sánh sự thay đổi của cơ quan trong quá trình phát triển, hoặc so sánh các mẫu mô có cấu trúc và thành phần phức tạp như mô não)

b. Single cell RNA-seq (scRNA-seq)

Là một công nghệ mới, được đề cập tới đầu tiên trong bài báo Tang et al. 2009
Trở nên phổ biến vào khoảng năm 2014 sau khi có nhiều phương pháp scRNA-seq mới ra đời và chi phí giải trình tự giảm xuống
Có rất nhiều protocol cho scRNA-seq được sử dụng, ví dụ SMART-seq2, CELL-seq, Drop-seq,…
Có nhiều hệ thống máy đã được thương mại hoá của scRNA-seq như Fluidigm C1, Wafergen ICELL8, và 10X Genomics Chromium,…
Nhiều phương pháp phân tích tính toán từ Bulk RNA-seq có thể được sử dụng cho scRNA-seq
Trong phần lớn các trường hợp, phương pháp phân tích tính toán yêu cầu sự thay đổi tương ứng hoặc phát triển những phương pháp mới
Đo phân bố biểu hiện của từng gene của từng tế bào một tập hợp tế bào đơn lẻ.
Mở ra những câu hỏi sinh học mới trong đó cho phép xác định sự thay đổi nào trong hệ phiên mã của một tế bào là quan trọng nhất(Ví dụ: đó có thể là loại tế bào, sự đáp ứng không đồng nhất của tế bào, tính ngẫu nhiên của gene biểu hiện, hệ quả của điều hoà hoạt động gene…)

2. Các bước cơ bản trong thí nghiệm scRNA-seq

Phân lập tế bào từ mô
Phân tách RNA từ từng tế bào
Tổng hợp cDNA, nhân lên cDNA bằng phản ứng PCR hoặc nhân lên cDNA thông qua phản ứng phiên mã trong ống nghiệm (in vitro transcription) kết hợp với phiên mã ngược
Tạo thư viện DNA giải trình tự và giải trình tự
Phân tích kết quả

RNA-Seq_workflow-5 pdf

4. Các bước cơ bản trong phân tích dữ liệu scRNA-seq

Phân tích dữ liệu scRNAseq thường bắt đầu với “Expression matrix”. Trong Expression matrix, mỗi hàng biểu diễn một gene và mỗi cột biểu diễn một tế bào. Như vậy, mỗi ô biểu diễn mức độ biểu hiện của một gene trong một tế bào. Các bước xây dựng một “Expression matrix” bao gồm:

Read Quality control: Đọc và kiểm tra chất lượng đoạn giải trình tự. (Công cụ: FastQC hay Karen).
Alignment: Liên kết đoạn giải trình tự với hệ genome tham khảo (reference genome) để tìm gene tương ứng với đoạn giải trình tự. (Công cụ sử dụng: STAR, TopHat)
Mapping Quality control: Kiểm tra độ chính xác của bước liên kết đoạn giải trình tự với reference genome dựa trên các chỉ số như: tỉ lệ giữa ribosome RNA và transposon RNA, tỉ lệ các đoạn nối đặc hiệu, độ sâu (read depth), đoạn đọc trải dài qua các điểm nối (splice junctions).
Reads Quantification: Tính toán mức độ biểu hiện của mỗi gene trong một tế bào. Với phương pháp scRNA-seq sử dụng kỹ thuật “tag-base”, UMI có thể được dùng để tính số lượng tuyệt đối của một phân tử RNA.

Sau khi được xây dựng, “Expression matrix” được dùng trong phân tích tiếp theo thông qua các nền tảng thiết kế riêng cho scRNA-seq.

Hiện nay, có rất nhiều nền tảng dùng để phân tích dữ liệu scRNA-seq. Tuy nhiên trong tutorials này chúng ta sẽ chủ yếu sử dụng các nền tảng sau:

Scanpy trong Python
Seurat trong R
Bioconductor: nguồn mở, chứa các phần mềm dùng cho phân tích dữ liệu genomics trong R

5. Thách thức

Sự khác biệt lớn nhất giữa phân tích Bulk RNA-seq và scRNA-seq là mỗi thư viện giải trình tự là đặc trưng của một tế bào thay vì của một quần thể tế bào. Vì vậy chúng ta cần lưu ý khi so sánh giữa các tế bào khác nhau. Những yếu tố có thể dẫn đến sự không tương quan khi so sánh bao gồm:

Sự nhân lên thiếu đồng đều của cDNA (Bias amplification)
Gene “bị loại bỏ” (Gene dropout) là trường hợp gene biểu hiện ở mức độ trung bình hoặc yếu trong một tế bào, nhưng không xuất hiện trong tế bào khác.

Nguyên nhân của việc này là do số lượng đầu vào thấp của RNA trong một tế bào. Làm thế nào để cải thiện hiệu suất và giảm sự không đồng đều vẫn đang được tiếp tục nghiên cứu

6. Phương pháp thí nghiệm

Có rất nhiều phương pháp thí nghiệm, tuy nhiên, các phương pháp này có thể được phân nhóm dựa trên hai đặc điểm sau: (1) Cách định lượng RNA (2) Cách “bắt giữ” từng tế bào

Có hai cách định lượng chính. Một là giải trình tự toàn bộ đoạn RNA (full-length). Hai là dùng “đầu dò” gắn đầu 3’ hoặc 5’, và chỉ giải trình tự đoạn gắn “đầu dò” (tag-based). Nên sử dụng phương pháp nào phụ thuộc vào mục đích tạo dữ liệu, vì cả hai đều có ưu và nhược điểm riêng. Về lí thuyết, “full-length” sẽ bao phổ (coverage) đồng đều đoạn phiên mã RNA. Tuy nhiên, thực tế cho thấy sự bao phổ (coverage) là không đồng đều. Nghĩa là có phần của đoạn phiên mã được bao phổ nhiều hơn so với các phần khác. Ưu điểm lớn nhất của phương pháp “tag-based” là có thêm trình tự nhận dạng phân tử đặc hiệu (Unique Molecular Identifier - UMI) trong đoạn mồi. Trình tự này là đặc trưng cho từng loại RNA khác nhau, vậy nên có thể được sử dụng trong định lượng. Tuy nhiên, nhược điểm của phương pháp này là bị giới hạn ở một đầu của RNA, và gây khó khăn trong việc phân biệt các isoform.

Khi nghĩ về phương pháp “bắt giữ” từng tế bào, chúng ta có thể xem xét ba sự lựa chọn sau: microwell, microfluidic, và droplet:

Microwell: sử dụng các phương pháp phân tách như FACS, pippette, laser capturing, để đưa từng tế bào vào trong một giếng có kích thước micro. Ưu điểm của microwell là có thể chụp hình ảnh của tế bào trong một giếng. Nhược điểm là quy mô nhỏ và khối lượng công việc lớn.
Microfulidic (Fluidigm C1): sử dụng nguyên lý thuỷ động lực học để dẫn dắt từng tế bào vào một buồng phản ứng. Ưu điểm là tính tự động hoá và quy mô cao hơn so với microwell. Tuy nhiên, hiệu suất thấp, chỉ có 10% số lượng tế bào được giữ lại ở các buồng phản ứng; và giá thành cho một đĩa “chip” quá đắt đỏ.
Droplet (10X Genomics, in-Drop): ý tưởng của phương pháp droplet là bao bọc một tế bào trong một giọt dầu đã có sẵn bead gắn đoạn mồi và nguyên liệu cho phản ứng tạo cDNA. Đây là phương pháp có hiệu suất và quy mô cao nhất trong ba loại.

Nguồn:

https://scrnaseq-course.cog.sanger.ac.uk/website/introduction-to-single-cell-rna-seq.html