Single cell RNA-seq quality control and filtering

Objectives

This notebook will demonstrate how to:

Import alevin results with tximeta
Calculate and examine cell quality measures

We will continue with the Tabula Muris data set that we started with in the previous notebook.

Roadmap: Preprocessing and Import

Set Up

# tximeta for importing alevin results
library(tximeta)

Warning: replacing previous import 'S4Arrays::makeNindexFromArrayViewport' by
'DelayedArray::makeNindexFromArrayViewport' when loading 'SummarizedExperiment'

# SingleCellExperiment package for organizing our results
library(SingleCellExperiment)

Loading required package: SummarizedExperiment

Loading required package: MatrixGenerics

Loading required package: matrixStats


Attaching package: 'MatrixGenerics'

The following objects are masked from 'package:matrixStats':

    colAlls, colAnyNAs, colAnys, colAvgsPerRowSet, colCollapse,
    colCounts, colCummaxs, colCummins, colCumprods, colCumsums,
    colDiffs, colIQRDiffs, colIQRs, colLogSumExps, colMadDiffs,
    colMads, colMaxs, colMeans2, colMedians, colMins, colOrderStats,
    colProds, colQuantiles, colRanges, colRanks, colSdDiffs, colSds,
    colSums2, colTabulates, colVarDiffs, colVars, colWeightedMads,
    colWeightedMeans, colWeightedMedians, colWeightedSds,
    colWeightedVars, rowAlls, rowAnyNAs, rowAnys, rowAvgsPerColSet,
    rowCollapse, rowCounts, rowCummaxs, rowCummins, rowCumprods,
    rowCumsums, rowDiffs, rowIQRDiffs, rowIQRs, rowLogSumExps,
    rowMadDiffs, rowMads, rowMaxs, rowMeans2, rowMedians, rowMins,
    rowOrderStats, rowProds, rowQuantiles, rowRanges, rowRanks,
    rowSdDiffs, rowSds, rowSums2, rowTabulates, rowVarDiffs, rowVars,
    rowWeightedMads, rowWeightedMeans, rowWeightedMedians,
    rowWeightedSds, rowWeightedVars

Loading required package: GenomicRanges

Loading required package: stats4

Loading required package: BiocGenerics


Attaching package: 'BiocGenerics'

The following objects are masked from 'package:stats':

    IQR, mad, sd, var, xtabs

The following objects are masked from 'package:base':

    anyDuplicated, aperm, append, as.data.frame, basename, cbind,
    colnames, dirname, do.call, duplicated, eval, evalq, Filter, Find,
    get, grep, grepl, intersect, is.unsorted, lapply, Map, mapply,
    match, mget, order, paste, pmax, pmax.int, pmin, pmin.int,
    Position, rank, rbind, Reduce, rownames, sapply, setdiff, table,
    tapply, union, unique, unsplit, which.max, which.min

Loading required package: S4Vectors


Attaching package: 'S4Vectors'

The following object is masked from 'package:utils':

    findMatches

The following objects are masked from 'package:base':

    expand.grid, I, unname

Loading required package: IRanges

Loading required package: GenomeInfoDb

Loading required package: Biobase

Welcome to Bioconductor

    Vignettes contain introductory material; view with
    'browseVignettes()'. To cite Bioconductor, see
    'citation("Biobase")', and for packages 'citation("pkgname")'.


Attaching package: 'Biobase'

The following object is masked from 'package:MatrixGenerics':

    rowMedians

The following objects are masked from 'package:matrixStats':

    anyMissing, rowMedians

# GGPlot2 for the plots
library(ggplot2)

Import single-cell RNA-seq quantification

Directories and files

The data files we will be using for this part of the project are in the data/tabula-muris subdirectory of the scRNA-seq directory where this notebook is located.

The main files we will be using at this stage are the results from our earlier quantification, located in the alevin-quant subdirectory. Rather than just the subset, we will use the full data in order to get a somewhat more realistic view of a 10x data set. This data set is still a few years old though: newer datasets will tend to have more cells!

# main data directory
data_dir <- file.path("data", "tabula-muris")

# reference files
ref_dir <- file.path("data", "reference")

# Path to the single-sample alevin results
alevin_file <- file.path(data_dir, "alevin-quant",
                         "10X_P4_3", "alevin", "quants_mat.gz")

# Mitochondrial gene table
mito_file <- file.path(ref_dir,
                       "mm_mitochondrial_genes.tsv")

# create the output directory using fs::dir_create()
filtered_dir <- file.path(data_dir, "filtered")
fs::dir_create(filtered_dir)

# Output file
filtered_sce_file <- file.path(filtered_dir, "filtered_sce.rds")

Importing alevin results with tximeta

tximeta needs a data frame with at least these two columns: - a files column with the file paths to the quant.mat.gz files - a names column with the sample names

In this case, we are only importing a single experiment, so we will create a data frame with only one row.

coldata <- data.frame(files = alevin_file,
                      names = "10X_P4_3")

Using the coldata data frame that we set up, we can now run the tximeta() to import our expression data while automatically finding and associating the transcript annotations that were used when we performed the quantification.

The first time you run tximeta() you may get a message about storing downloaded transcriptome data in a cache directory so that it can retrieve the data more quickly the next time. We recommend you use the cache, and accept the default location.

# Read in alevin results with tximeta
bladder_sce <- tximeta(coldata, type = "alevin")

importing quantifications

reading in alevin gene-level counts across cells with 'eds'

found matching transcriptome:
[ Ensembl - Mus musculus - release 95 ]

useHub=TRUE: checking for EnsDb via 'AnnotationHub'

found matching EnsDb via 'AnnotationHub'

downloading 1 resources

retrieving 1 resource

loading from cache

require("ensembldb")

generating gene ranges

generating gene ranges

A quick aside! When we ran alevinQC on this data in the last notebook, we saw that salmon alevin had identified a “whitelist” of barcodes that passed its quality control standards. We could use this filtered list directly, but salmon alevin can be quite strict, and methods for filtering quite variable. Instead, we will use the default behavior of tximeta() and read in all of the barcodes for which there is a non-zero UMI count (after barcode correction). If you wanted instead to include only only barcodes that passed salmon alevin’s filter, you could supply the additional argument alevinArgs = list(filterBarcodes=TRUE) to the tximeta() function. Even if you do choose to read in pre-filtered data, it’s still important to explore the data as we’re about to do here and potentially filter further based on your observations, in particular since mapping software’s quality control measures (spoilers!) don’t always filter based on mitochondrial gene content.

In the intro-to-R-tidyverse module notebook, 01-intro-to-base_R.Rmd, we discuss base R object types, but there are some ‘special’ object types that are package-specific. tximeta creates a SummarizedExperiment object (or more specifically a RangedSummarizedExperiment object), which is used by many Bioconductor packages to store and process results from gene expression studies.

# Explore the SummarizedExperiment data
bladder_sce

class: RangedSummarizedExperiment 
dim: 35429 344 
metadata(6): tximetaInfo quantInfo ... txomeInfo txdbInfo
assays(1): counts
rownames(35429): ENSMUSG00000000001 ENSMUSG00000000003 ...
  ENSMUSG00000117649 ENSMUSG00000117651
rowData names(8): gene_id gene_name ... symbol entrezid
colnames(344): CGGAGTCAGTACGCCC TTGGCAACATGATCCA ... ACGTCAAGTGTAATGA
  ATTACTCAGAGAACAG
colData names(0):

The main component we are concerned with for now is the counts matrix, which is stored as an “assay”, with a row for each gene and a column for each cell. In this case, we can see there is information for 35,429 genes, and Alevin reports data for 344 cells.

tximeta also automatically added some annotation information about each gene, which can be seen by extracting the rowData table.

# Examine row (gene) metadata
rowData(bladder_sce)

DataFrame with 35429 rows and 8 columns
                              gene_id   gene_name         gene_biotype
                          <character> <character>          <character>
ENSMUSG00000000001 ENSMUSG00000000001       Gnai3       protein_coding
ENSMUSG00000000003 ENSMUSG00000000003        Pbsn       protein_coding
ENSMUSG00000000028 ENSMUSG00000000028       Cdc45       protein_coding
ENSMUSG00000000037 ENSMUSG00000000037       Scml2       protein_coding
ENSMUSG00000000049 ENSMUSG00000000049        Apoh       protein_coding
...                               ...         ...                  ...
ENSMUSG00000117643 ENSMUSG00000117643  AC122453.2 processed_pseudogene
ENSMUSG00000117644 ENSMUSG00000117644  AC108777.1 processed_pseudogene
ENSMUSG00000117646 ENSMUSG00000117646  AC122271.3 processed_pseudogene
ENSMUSG00000117649 ENSMUSG00000117649  AC165087.2 processed_pseudogene
ENSMUSG00000117651 ENSMUSG00000117651  CT485613.6 processed_pseudogene
                   seq_coord_system            description
                        <character>            <character>
ENSMUSG00000000001       chromosome guanine nucleotide b..
ENSMUSG00000000003       chromosome probasin [Source:MGI..
ENSMUSG00000000028       chromosome cell division cycle ..
ENSMUSG00000000037       chromosome Scm polycomb group p..
ENSMUSG00000000049       chromosome apolipoprotein H [So..
...                             ...                    ...
ENSMUSG00000117643       chromosome Wilms tumour 1-assoc..
ENSMUSG00000117644       chromosome gametocyte specific ..
ENSMUSG00000117646       chromosome developmental plurip..
ENSMUSG00000117649       chromosome heterogeneous nuclea..
ENSMUSG00000117651       chromosome NSE1 homolog, SMC5-S..
                         gene_id_version      symbol entrezid
                             <character> <character>   <list>
ENSMUSG00000000001  ENSMUSG00000000001.4       Gnai3    14679
ENSMUSG00000000003 ENSMUSG00000000003.15        Pbsn    54192
ENSMUSG00000000028 ENSMUSG00000000028.15       Cdc45    12544
ENSMUSG00000000037 ENSMUSG00000000037.16       Scml2   107815
ENSMUSG00000000049 ENSMUSG00000000049.11        Apoh    11818
...                                  ...         ...      ...
ENSMUSG00000117643  ENSMUSG00000117643.1  AC122453.2       NA
ENSMUSG00000117644  ENSMUSG00000117644.1  AC108777.1       NA
ENSMUSG00000117646  ENSMUSG00000117646.1  AC122271.3       NA
ENSMUSG00000117649  ENSMUSG00000117649.1  AC165087.2       NA
ENSMUSG00000117651  ENSMUSG00000117651.1  CT485613.6       NA

We could leave the object as it is, but we can unlock some extra functionality by converting this from a SummarizedExperiment object to a SingleCellExperiment, so we will go ahead and do that next. SingleCellExperiment objects are a subtype of SummarizedExperiment objects that a lot of single-cell analysis R packages use, so we will try to get acquainted with them.

For more information on SingleCellExperiment objects, as well as many other topics related to this course, we highly recommend the e-book Orchestrating Single-Cell Analysis with Bioconductor (OSCA) and/or Amezquita et al. (2020).

Below is a figure from OSCA that shows the general structure of SingleCellExperiment objects.

Note that three are slots for raw data, metadata about cells, metadata about genes or features, and slots for various transformations of the input data. Many of these will not be filled in when we first create the object, but as we proceed through the workshop we will add in more data to these slots as we compute new summaries and transformations.

To perform the conversion to a SingleCellExperiment, we will use the R function as(), which “coerces” objects from one type to another.

# Convert the SummarizedExperiment to a SingleCellExperiment
bladder_sce <- as(bladder_sce, "SingleCellExperiment")
bladder_sce

class: SingleCellExperiment 
dim: 35429 344 
metadata(6): tximetaInfo quantInfo ... txomeInfo txdbInfo
assays(1): counts
rownames(35429): ENSMUSG00000000001 ENSMUSG00000000003 ...
  ENSMUSG00000117649 ENSMUSG00000117651
rowData names(8): gene_id gene_name ... symbol entrezid
colnames(344): CGGAGTCAGTACGCCC TTGGCAACATGATCCA ... ACGTCAAGTGTAATGA
  ATTACTCAGAGAACAG
colData names(0):
reducedDimNames(0):
mainExpName: NULL
altExpNames(0):

Doing this added a couple of (currently empty) slots for things like dimensionality reduction results and alternative feature experiments. Foreshadowing!

Summarizing expression

For a first pass at the data, we will extract just the counts matrix from the SingleCellExperiment object, and use some base R functions to look at our results.

We can extract the gene by cell count matrix using the counts() function. This actually returns a special format of matrix called a “sparse” matrix. Since single cell count data is mostly zeros, this format (a dgCMatrix object) allows R to save a lot of memory. This object takes up about 6.4 MB, but if we stored it in the normal format, it would be closer to 100 MB! Thankfully, most of the functions that we use to work with regular matrices work just fine with these as well.

sc_counts <- counts(bladder_sce)

Let’s look at the mean expression of the genes in this dataset. We will use apply() in order to calculate things across our data frame. The second argument in apply() specifies whether we are calculating by rows or columns. (1 = rows, 2 = columns).

In the code chunk below, use apply() with the correct arguments to calculate the gene means.

# Let's calculate the gene means (by row)
gene_means <- apply(sc_counts, 1, mean)

This works just fine, but you may have noticed it is a bit slow. For a few common summary functions like means and sums, R has much more efficient functions to calculate across rows or columns. In this case, we can use rowMeans() to do the same calculation much more quickly.

# use rowMeans() to calculate gene means
gene_means <- rowMeans(sc_counts)

Let’s make our first density plot with these data. We will use ggplot() as you have seen before, but since the object we want to plot, gene_means, is a vector not a data frame, we will skip the data argument and go straight to the mapping aesthetics. The remainder of the ggplot code should look familiar.

# Plot the density of the means using ggplot2
ggplot(mapping = aes(x = gene_means)) +
  geom_density() +
  labs(x = "Mean gene count")

That plot is not quite as informative as we might like, as a few genes with high expression are making the scale just a bit wide. Lets zoom in on the left part of the graph by adding an xlim() argument. (Note that xlim() will remove points outside the specified range, so you will get a warning.)

# Plot the density of the means using ggplot2
ggplot(mapping = aes(x = gene_means)) +
  geom_density() +
  labs(x = "Mean gene count") +
  xlim(0, 5)

Warning: Removed 203 rows containing non-finite outside the scale range
(`stat_density()`).

Even as we zoom in, the counts data has many zeroes, which we actually expect in a single cell RNA-seq experiment.

Let’s calculate what proportion of the count data is zeros:

sum(sc_counts == 0)/(nrow(sc_counts) * ncol(sc_counts))

[1] 0.9447591

Quality control measures for the counts matrix

The small amount of RNA in a single cell results in higher chances of errors and biases in RNA isolation, amplification, and sequencing. We should check that the overall data we observe for each sample/cell are reasonable before proceeding too far.

The next section explores some of the ways we can filter the data set to clean things up before we continue to downstream analysis.

QC and filtering

Total counts as a quality measure

First, lets look at the total number of counts per cell, across all genes. For this we will use colSums(), as each column represents a different sampled cell.

# Make a vector of total_counts number of counts per sample using colSums()
total_counts <- colSums(sc_counts)

# Take a look at the summary statistics for the total counts
summary(total_counts)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    1.0   287.8  3971.5  8089.9 12008.8 62446.0

Yikes, at least one of the cells has only 1 read!, compared to the median of ~4000! It’s highly likely that this ‘cell’ is either an empty well or did not get sequenced properly.

Let’s visualize the distribution of total counts to see if this is the only cell we might want to exclude.

In following graphs, we will use vertical red lines to indicate possible cutoffs.

# Let's use the same kind of plot as above but add more layers
ggplot(mapping = aes(x = total_counts)) +
  geom_density(fill = "lightblue") +
  geom_vline(xintercept = 1000, color = "red") +
  labs(x = "Counts per cell")

How many cells would be removed with this (or other cutoffs) for counts per sample?

# Calculate the number of cells that would be removed with a given cutoff
count_cutoff <- 1000
sum(total_counts <= count_cutoff)

[1] 133

Number of genes a cell expressed as a quality measure

What if a single gene accounted for all counts in a particular cell? This cell would not have helpful data for us, so we should look to remove any cells we suspect might not have a useful amount of its transcriptome measured.

But before we can determine how many genes we consider a particular cell to be expressing we need to determine a numeric cutoff for what we consider to be a detected gene. How many counts must there be for you to consider a gene expressed? Here let’s go for a simple detection cutoff of > 0.

# make a detection_mat matrix that is TRUE when a gene is expressed in a sample
detection_mat <- sc_counts > 0

Now that we have turned our data into a matrix of TRUE/FALSE for detection, we can sum this data by column to effectively get a vector of how many genes were measured in each cell.

# Make a vector that contains the number of genes expressed by a particular cell
num_genes_exp <- colSums(detection_mat)

Let’s plot this using the same style and type of graph as above.

ggplot(mapping = aes(x = num_genes_exp)) +
  geom_density(fill = "lightblue") +
  labs(x = "Number of genes expressed") +
  theme_classic()

This plot helps us visualize the distribution of genes per cell and can help inform how we choose the cutoff. It’s important to remember that different cell types can have quite different patterns with regards to number of genes expressed. If we were to use strict cutoffs to select which cells are “valid”, there is the possibility that we could bias our results, so this is something we want to be careful about.

Let’s see what happens if we only keep cells with > 500 expressed genes. Just like when we looked at total counts, we can add in a vertical line to the previous plot where the possible cutoff would be.

ggplot(mapping = aes(x = num_genes_exp)) +
  geom_density(fill = "lightblue") +
  labs(x = "Number of genes expressed") +
  theme_classic() +
  geom_vline(xintercept = 500, color = "red")

How many cells would be removed with this cutoff?

# Calculate the number of cells that would be removed with a given cutoff
gene_cutoff <- 500
sum(num_genes_exp <= gene_cutoff)

[1] 145

Mitochondrial gene expression

If a cell is dead or dying, its mRNA will tend to leak out of the cell, leaving an overabundance of mitochondrial RNA, which is more likely to stay within the mitochondria longer. To look for this, we would like to calculate the fraction of mitochondrial expression for each cell as well. First, we will need a list of the mitochondrial genes, which we have prepared in a tsv file mm_mitochondrial_genes.tsv that we will now read in, and filter to just the genes that are found in the data set.

# read `mm_mitochondrial_genes.tsv` from ref_dir and
# create from it a single vector containing only the gene ids
mito_genes <- readr::read_tsv(mito_file) |>
  # filter to only gene in the sce object
  dplyr::filter(gene_id %in% rownames(bladder_sce)) |>
  # pull takes this column out of the data frame as a stand-alone vector
  dplyr::pull(gene_id)

Rows: 37 Columns: 13
── Column specification ────────────────────────────────────────────────────────
Delimiter: "\t"
chr (9): gene_id, gene_name, seqnames, strand, gene_biotype, seq_coord_syste...
dbl (4): start, end, width, entrezid

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Now we can use the genes from that list to select only the rows of the count matrix that correspond to the mitochondrial genes and sum their expression for each sample.

# create a mito_rows vector that is TRUE for mitochondrial genes in our dataset
mito_rows <- rownames(sc_counts) %in% mito_genes

# sum the counts from just those genes for all samples
mito_counts <- colSums(sc_counts[mito_rows, ])

# calculate mito_fraction for all samples
mito_fraction <- mito_counts/total_counts

Lets make a plot of this distribution as well!

ggplot(mapping = aes(x = mito_fraction)) +
  geom_density(fill = "lightblue") +
  labs(x = "Mitchondrial fraction") +
  geom_vline(xintercept = 0.2, color = "red") +
  theme_classic()

Here, we want to keep cells with a low fraction of reads corresponding to mitochondrial genes and remove any cells with a high mitochondrial fraction. Again, it’s important to take this step even if you started with filtered data, since mapping software like salmon alevin and Cell Ranger do not usually consider mitochondrial read percentages when filtering.

Combining sample QC measures

Lets put all of the QC measures we have calculated into a single data frame, so we can look at how they might relate to one another.

# make a data frame with number of genes expressed, total counts, and mito fraction
qc_df <- data.frame(barcode = names(num_genes_exp),
                    genes_exp = num_genes_exp,
                    total_counts = total_counts,
                    mito_fraction = mito_fraction)

Now we can plot these measures all together, along with some possible cutoffs.

ggplot(qc_df, aes (x = total_counts,
                   y = genes_exp,
                   color = mito_fraction)) +
  geom_point(alpha = 0.5) +
  scale_color_viridis_c() +
  geom_vline(xintercept = 1000, color = "red") +
  geom_hline(yintercept = 500, color = "red") +
  labs(x = "Total Count",
       y = "Number of Genes Expressed",
       color = "Mitochondrial\nFraction") +
  theme_bw()

If we want to filter our data based on these measures and cutoffs we like, we can do this with dplyr::filter() and then select the resulting columns from the matrix.

# create a filtered_samples data frame from qc_df
filtered_samples <- qc_df |>
  dplyr::filter(total_counts > 1000,
                genes_exp > 500,
                mito_fraction < 0.2)
# select only passing samples for bladder_sce_filtered
sc_counts_filtered <- sc_counts[, filtered_samples$barcode]

Filtering the `SingleCellExperiment` directly

Calculating cell QC stats with `scater`

The methods above were nice for demonstrating the kinds of filtering we might do, but all the steps would certainly be repetitive if we had to do them for each sample. Thankfully, there are some nice methods that have been developed in packages like scater to perform them all at once and add the results to the SingleCellExperiment object. The advantages of using functions like this are that we can keep all of the metadata together, filter directly on the object of interest, avoid a lot of repetition, and in doing so avoid many potential errors.

We will start with the function addPerCellQC(), which takes a SingleCellExperiment and a list of gene sets that that we might want to calculate subset information for. In our case, we will just look at mitochondrial genes again.

bladder_sce <- scater::addPerCellQC(
  bladder_sce,
  # a list of named gene subsets that we want stats for
  # here we are using mitochondrial genes
  subsets = list(mito = mito_genes)
  )

The results of these calculations are now stored as a data frame in the colData slot of the SingleCellExperiment object, which we can pull out with the colData() function. (Unfortunately, it is not quite a regular data frame, but we can easily convert it to one.) Even nicer, we can access the QC data in those columns directly with just the familiar $ syntax!

The calculated statistics include sum, the total UMI count for the cell, detected, the number of genes detected, and a few different statistics for each subset that we gave, including the percent (not fraction!) of all UMIs from the subset. Since the subset we used was named mito, this column is called subsets_mito_percent.

Using these, we can recreate the plot from before:

# extract the column data and convert to a data frame
bladder_qc <- data.frame(colData(bladder_sce))

# plot with the qc data frame
ggplot(bladder_qc, aes (x = sum,
                        y = detected,
                       color = subsets_mito_percent)) +
  geom_point(alpha = 0.5) +
  scale_color_viridis_c() +
  labs(x = "Total Count",
       y = "Number of Genes Expressed",
       color = "Mitochondrial\nFraction") +
  theme_bw()

Applying a filter to a `SingleCellExperiment`

Filtering the SingleCellExperiment object is done as if it were just the counts matrix, with brackets and indexes. While this will look much like what we did before, it is better, because it will also keep the filtered QC stats alongside, in case we wanted to revisit them later. Otherwise, we would have to filter our QC results separately, which is an easy place for errors to creep in.

# create a boolean vector of QC filters
cells_to_keep <- bladder_sce$sum > 1000 &
  bladder_sce$detected > 500 &
  bladder_sce$subsets_mito_percent < 20

# filter the sce object (cells are columns)
bladder_sce_filtered <- bladder_sce[, cells_to_keep]

Just to check, we should have the same number of cells in bladder_sce_filtered as our previous sc_counts_filtered.

ncol(sc_counts_filtered) == ncol(bladder_sce_filtered)

[1] TRUE

Number of cells that express a gene as a quality measure

Now we have an idea of what cells we probably want to get rid of. But what if our data contains genes that we can’t reliably measure in these cells?

We could use our earlier detection_mat to add up how many cells express each gene, but we will skip straight to the scater function this time, which is called addPerFeatureQC(). This will add QC statistics to the rowData for each gene (alongside the annotation data we already had there) The columns it adds are the average expression level of each gene (mean) and the percentage of cells in which it was detected (detected).

bladder_sce_filtered <- scater::addPerFeatureQC(bladder_sce_filtered)

Let’s make another density plot with the percentage of samples that express each gene:

# extract the gene information with
gene_info <- data.frame(rowData(bladder_sce_filtered))

# Plot the detected percentage
ggplot(gene_info, aes(x = detected) )+
  geom_density(fill = "lightblue") +
  labs(x = "Percent of Cells Expressing Each Gene") +
  theme_classic()

How many genes will be excluded if we draw our cutoff at 5% of cells?

sum(gene_info$detected < 5)

[1] 23960

That’s a lot! How do we feel about that?

cutoff <- 2
# filter bladder_sce_filtered to only genes above a cutoff value
bladder_sce_filtered <- bladder_sce_filtered[gene_info$detected >= cutoff, ]

How big is the SingleCellExperiment object now?

dim(bladder_sce_filtered)

[1] 13648   186

Save the filtered data

We will save the filtered SingleCellExperiment object as a .rds file for later use.

# Save object to the file filtered_sce_file, which
# we defined at the top of this notebook
readr::write_rds(bladder_sce_filtered, file = filtered_sce_file)

Print session info

sessionInfo()

R version 4.4.1 (2024-06-14)
Platform: x86_64-pc-linux-gnu
Running under: Ubuntu 22.04.4 LTS

Matrix products: default
BLAS:   /usr/lib/x86_64-linux-gnu/openblas-pthread/libblas.so.3 
LAPACK: /usr/lib/x86_64-linux-gnu/openblas-pthread/libopenblasp-r0.3.20.so;  LAPACK version 3.10.0

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
 [3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
 [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
 [7] LC_PAPER=en_US.UTF-8       LC_NAME=C                 
 [9] LC_ADDRESS=C               LC_TELEPHONE=C            
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

time zone: Etc/UTC
tzcode source: system (glibc)

attached base packages:
[1] stats4    stats     graphics  grDevices utils     datasets  methods  
[8] base     

other attached packages:
 [1] ensembldb_2.28.0            AnnotationFilter_1.28.0    
 [3] GenomicFeatures_1.56.0      AnnotationDbi_1.66.0       
 [5] ggplot2_3.5.1               SingleCellExperiment_1.26.0
 [7] SummarizedExperiment_1.34.0 Biobase_2.64.0             
 [9] GenomicRanges_1.56.0        GenomeInfoDb_1.40.0        
[11] IRanges_2.38.0              S4Vectors_0.42.0           
[13] BiocGenerics_0.50.0         MatrixGenerics_1.16.0      
[15] matrixStats_1.3.0           tximeta_1.22.0             
[17] optparse_1.7.5             

loaded via a namespace (and not attached):
  [1] jsonlite_1.8.8            tximport_1.32.0          
  [3] magrittr_2.0.3            ggbeeswarm_0.7.2         
  [5] farver_2.1.1              rmarkdown_2.26           
  [7] fs_1.6.4                  BiocIO_1.14.0            
  [9] zlibbioc_1.50.0           vctrs_0.6.5              
 [11] memoise_2.0.1             Rsamtools_2.20.0         
 [13] DelayedMatrixStats_1.26.0 RCurl_1.98-1.14          
 [15] htmltools_0.5.8.1         S4Arrays_1.4.0           
 [17] progress_1.2.3            AnnotationHub_3.12.0     
 [19] curl_5.2.1                BiocNeighbors_1.22.0     
 [21] SparseArray_1.4.0         sass_0.4.9               
 [23] bslib_0.7.0               httr2_1.0.1              
 [25] cachem_1.0.8              GenomicAlignments_1.40.0 
 [27] mime_0.12                 lifecycle_1.0.4          
 [29] pkgconfig_2.0.3           rsvd_1.0.5               
 [31] Matrix_1.7-0              R6_2.5.1                 
 [33] fastmap_1.1.1             GenomeInfoDbData_1.2.12  
 [35] digest_0.6.35             colorspace_2.1-0         
 [37] scater_1.32.0             irlba_2.3.5.1            
 [39] RSQLite_2.3.6             beachmat_2.20.0          
 [41] filelock_1.0.3            labeling_0.4.3           
 [43] fansi_1.0.6               httr_1.4.7               
 [45] abind_1.4-5               compiler_4.4.1           
 [47] bit64_4.0.5               withr_3.0.0              
 [49] BiocParallel_1.38.0       viridis_0.6.5            
 [51] DBI_1.2.2                 highr_0.10               
 [53] biomaRt_2.60.0            rappdirs_0.3.3           
 [55] DelayedArray_0.30.0       rjson_0.2.21             
 [57] tools_4.4.1               vipor_0.4.7              
 [59] beeswarm_0.4.0            glue_1.7.0               
 [61] restfulr_0.0.15           grid_4.4.1               
 [63] generics_0.1.3            gtable_0.3.5             
 [65] tzdb_0.4.0                hms_1.1.3                
 [67] ScaledMatrix_1.12.0       BiocSingular_1.20.0      
 [69] xml2_1.3.6                utf8_1.2.4               
 [71] XVector_0.44.0            ggrepel_0.9.5            
 [73] BiocVersion_3.19.1        pillar_1.9.0             
 [75] stringr_1.5.1             vroom_1.6.5              
 [77] dplyr_1.1.4               getopt_1.20.4            
 [79] BiocFileCache_2.12.0      lattice_0.22-6           
 [81] rtracklayer_1.64.0        bit_4.0.5                
 [83] tidyselect_1.2.1          Biostrings_2.72.0        
 [85] scuttle_1.14.0            knitr_1.46               
 [87] gridExtra_2.3             ProtGenerics_1.36.0      
 [89] xfun_0.43                 eds_1.6.0                
 [91] stringi_1.8.3             UCSC.utils_1.0.0         
 [93] lazyeval_0.2.2            yaml_2.3.8               
 [95] evaluate_0.23             codetools_0.2-20         
 [97] tibble_3.2.1              BiocManager_1.30.22      
 [99] cli_3.6.2                 munsell_0.5.1            
 [ reached getOption("max.print") -- omitted 18 entries ]

LS0tCnRpdGxlOiAiU2luZ2xlIGNlbGwgUk5BLXNlcSBxdWFsaXR5IGNvbnRyb2wgYW5kIGZpbHRlcmluZyIKYXV0aG9yOiBDQ0RMIGZvciBBTFNGCmRhdGU6IDIwMjEKb3V0cHV0OgogIGh0bWxfbm90ZWJvb2s6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQotLS0KCiMjIE9iamVjdGl2ZXMKClRoaXMgbm90ZWJvb2sgd2lsbCBkZW1vbnN0cmF0ZSBob3cgdG86CgotIEltcG9ydCBhbGV2aW4gcmVzdWx0cyB3aXRoIGB0eGltZXRhYAotIENhbGN1bGF0ZSBhbmQgZXhhbWluZSBjZWxsIHF1YWxpdHkgbWVhc3VyZXMKCi0tLQoKV2Ugd2lsbCBjb250aW51ZSB3aXRoIHRoZSBUYWJ1bGEgTXVyaXMgZGF0YSBzZXQgdGhhdCB3ZSBzdGFydGVkIHdpdGggaW4gdGhlIHByZXZpb3VzIG5vdGVib29rLgoKIVtSb2FkbWFwOiBQcmVwcm9jZXNzaW5nIGFuZCBJbXBvcnRdKGRpYWdyYW1zL3JvYWRtYXBfc2luZ2xlX3ByZXByb2Nlc3NfYWxldmluLnBuZykKCiMjIFNldCBVcAoKYGBge3Igc2V0dXB9CiMgdHhpbWV0YSBmb3IgaW1wb3J0aW5nIGFsZXZpbiByZXN1bHRzCmxpYnJhcnkodHhpbWV0YSkKCiMgU2luZ2xlQ2VsbEV4cGVyaW1lbnQgcGFja2FnZSBmb3Igb3JnYW5pemluZyBvdXIgcmVzdWx0cwpsaWJyYXJ5KFNpbmdsZUNlbGxFeHBlcmltZW50KQoKIyBHR1Bsb3QyIGZvciB0aGUgcGxvdHMKbGlicmFyeShnZ3Bsb3QyKQpgYGAKCiMjIEltcG9ydCBzaW5nbGUtY2VsbCBSTkEtc2VxIHF1YW50aWZpY2F0aW9uCgoKCiMjIyBEaXJlY3RvcmllcyBhbmQgZmlsZXMKClRoZSBkYXRhIGZpbGVzIHdlIHdpbGwgYmUgdXNpbmcgZm9yIHRoaXMgcGFydCBvZiB0aGUgcHJvamVjdCBhcmUgaW4gdGhlIGBkYXRhL3RhYnVsYS1tdXJpc2Agc3ViZGlyZWN0b3J5IG9mIHRoZSBgc2NSTkEtc2VxYCBkaXJlY3Rvcnkgd2hlcmUgdGhpcyBub3RlYm9vayBpcyBsb2NhdGVkLgoKVGhlIG1haW4gZmlsZXMgd2Ugd2lsbCBiZSB1c2luZyBhdCB0aGlzIHN0YWdlIGFyZSB0aGUgcmVzdWx0cyBmcm9tIG91ciBlYXJsaWVyIHF1YW50aWZpY2F0aW9uLCBsb2NhdGVkIGluIHRoZSBgYWxldmluLXF1YW50YCBzdWJkaXJlY3RvcnkuClJhdGhlciB0aGFuIGp1c3QgdGhlIHN1YnNldCwgd2Ugd2lsbCB1c2UgdGhlIGZ1bGwgZGF0YSBpbiBvcmRlciB0byBnZXQgYSBzb21ld2hhdCBtb3JlIHJlYWxpc3RpYyB2aWV3IG9mIGEgMTB4IGRhdGEgc2V0LgpUaGlzIGRhdGEgc2V0IGlzIHN0aWxsIGEgZmV3IHllYXJzIG9sZCB0aG91Z2g6IG5ld2VyIGRhdGFzZXRzIHdpbGwgdGVuZCB0byBoYXZlIG1vcmUgY2VsbHMhCgpgYGB7ciBmaWxlcGF0aHN9CiMgbWFpbiBkYXRhIGRpcmVjdG9yeQpkYXRhX2RpciA8LSBmaWxlLnBhdGgoImRhdGEiLCAidGFidWxhLW11cmlzIikKCiMgcmVmZXJlbmNlIGZpbGVzCnJlZl9kaXIgPC0gZmlsZS5wYXRoKCJkYXRhIiwgInJlZmVyZW5jZSIpCgojIFBhdGggdG8gdGhlIHNpbmdsZS1zYW1wbGUgYWxldmluIHJlc3VsdHMKYWxldmluX2ZpbGUgPC0gZmlsZS5wYXRoKGRhdGFfZGlyLCAiYWxldmluLXF1YW50IiwKICAgICAgICAgICAgICAgICAgICAgICAgICIxMFhfUDRfMyIsICJhbGV2aW4iLCAicXVhbnRzX21hdC5neiIpCgojIE1pdG9jaG9uZHJpYWwgZ2VuZSB0YWJsZQptaXRvX2ZpbGUgPC0gZmlsZS5wYXRoKHJlZl9kaXIsCiAgICAgICAgICAgICAgICAgICAgICAgIm1tX21pdG9jaG9uZHJpYWxfZ2VuZXMudHN2IikKCiMgY3JlYXRlIHRoZSBvdXRwdXQgZGlyZWN0b3J5IHVzaW5nIGZzOjpkaXJfY3JlYXRlKCkKZmlsdGVyZWRfZGlyIDwtIGZpbGUucGF0aChkYXRhX2RpciwgImZpbHRlcmVkIikKZnM6OmRpcl9jcmVhdGUoZmlsdGVyZWRfZGlyKQoKIyBPdXRwdXQgZmlsZQpmaWx0ZXJlZF9zY2VfZmlsZSA8LSBmaWxlLnBhdGgoZmlsdGVyZWRfZGlyLCAiZmlsdGVyZWRfc2NlLnJkcyIpCmBgYAoKCiMjIEltcG9ydGluZyBhbGV2aW4gcmVzdWx0cyB3aXRoIHR4aW1ldGEKCmB0eGltZXRhYCBuZWVkcyBhIGRhdGEgZnJhbWUgd2l0aCBhdCBsZWFzdCB0aGVzZSB0d28gY29sdW1uczoKLSBhIGBmaWxlc2AgY29sdW1uICB3aXRoIHRoZSBmaWxlIHBhdGhzIHRvIHRoZSBxdWFudC5tYXQuZ3ogZmlsZXMKLSBhIGBuYW1lc2AgY29sdW1uIHdpdGggdGhlIHNhbXBsZSBuYW1lcwoKSW4gdGhpcyBjYXNlLCB3ZSBhcmUgb25seSBpbXBvcnRpbmcgYSBzaW5nbGUgZXhwZXJpbWVudCwgc28gd2Ugd2lsbCBjcmVhdGUgYSBkYXRhIGZyYW1lIHdpdGggb25seSBvbmUgcm93LgoKYGBge3IgbmFtZXNfc2ZfZmlsZXMsIGxpdmUgPSBUUlVFfQpjb2xkYXRhIDwtIGRhdGEuZnJhbWUoZmlsZXMgPSBhbGV2aW5fZmlsZSwKICAgICAgICAgICAgICAgICAgICAgIG5hbWVzID0gIjEwWF9QNF8zIikKYGBgCgpVc2luZyB0aGUgYGNvbGRhdGFgIGRhdGEgZnJhbWUgdGhhdCB3ZSBzZXQgdXAsIHdlIGNhbiBub3cgcnVuIHRoZSBgdHhpbWV0YSgpYCB0byBpbXBvcnQgb3VyIGV4cHJlc3Npb24gZGF0YSB3aGlsZSBhdXRvbWF0aWNhbGx5IGZpbmRpbmcgYW5kIGFzc29jaWF0aW5nIHRoZSB0cmFuc2NyaXB0IGFubm90YXRpb25zIHRoYXQgd2VyZSB1c2VkIHdoZW4gd2UgcGVyZm9ybWVkIHRoZSBxdWFudGlmaWNhdGlvbi4KClRoZSBmaXJzdCB0aW1lIHlvdSBydW4gYHR4aW1ldGEoKWAgeW91IG1heSBnZXQgYSBtZXNzYWdlIGFib3V0IHN0b3JpbmcgZG93bmxvYWRlZCB0cmFuc2NyaXB0b21lIGRhdGEgaW4gYSBjYWNoZSBkaXJlY3Rvcnkgc28gdGhhdCBpdCBjYW4gcmV0cmlldmUgdGhlIGRhdGEgbW9yZSBxdWlja2x5IHRoZSBuZXh0IHRpbWUuCldlIHJlY29tbWVuZCB5b3UgdXNlIHRoZSBjYWNoZSwgYW5kIGFjY2VwdCB0aGUgZGVmYXVsdCBsb2NhdGlvbi4KCgpgYGB7ciByZWFkX2RhdGEsIGxpdmUgPSBUUlVFfQojIFJlYWQgaW4gYWxldmluIHJlc3VsdHMgd2l0aCB0eGltZXRhCmJsYWRkZXJfc2NlIDwtIHR4aW1ldGEoY29sZGF0YSwgdHlwZSA9ICJhbGV2aW4iKQpgYGAKCkEgcXVpY2sgYXNpZGUhCldoZW4gd2UgcmFuIGBhbGV2aW5RQ2Agb24gdGhpcyBkYXRhIGluIHRoZSBsYXN0IG5vdGVib29rLCB3ZSBzYXcgdGhhdCBgc2FsbW9uIGFsZXZpbmAgaGFkIGlkZW50aWZpZWQgYSAid2hpdGVsaXN0IiBvZiBiYXJjb2RlcyB0aGF0IHBhc3NlZCBpdHMgcXVhbGl0eSBjb250cm9sIHN0YW5kYXJkcy4KV2UgY291bGQgdXNlIHRoaXMgZmlsdGVyZWQgbGlzdCBkaXJlY3RseSwgYnV0IGBzYWxtb24gYWxldmluYCBjYW4gYmUgcXVpdGUgc3RyaWN0LCBhbmQgbWV0aG9kcyBmb3IgZmlsdGVyaW5nIHF1aXRlIHZhcmlhYmxlLgpJbnN0ZWFkLCB3ZSB3aWxsIHVzZSB0aGUgZGVmYXVsdCBiZWhhdmlvciBvZiBgdHhpbWV0YSgpYCBhbmQgcmVhZCBpbiBhbGwgb2YgdGhlIGJhcmNvZGVzIGZvciB3aGljaCB0aGVyZSBpcyBhIG5vbi16ZXJvIFVNSSBjb3VudCAoYWZ0ZXIgYmFyY29kZSBjb3JyZWN0aW9uKS4KSWYgeW91IHdhbnRlZCBpbnN0ZWFkIHRvIGluY2x1ZGUgb25seSBvbmx5IGJhcmNvZGVzIHRoYXQgcGFzc2VkIGBzYWxtb24gYWxldmluYCdzIGZpbHRlciwgeW91IGNvdWxkIHN1cHBseSB0aGUgYWRkaXRpb25hbCBhcmd1bWVudCBgYWxldmluQXJncyA9IGxpc3QoZmlsdGVyQmFyY29kZXM9VFJVRSlgIHRvIHRoZSBgdHhpbWV0YSgpYCBmdW5jdGlvbi4KRXZlbiBpZiB5b3UgZG8gY2hvb3NlIHRvIHJlYWQgaW4gcHJlLWZpbHRlcmVkIGRhdGEsIGl0J3Mgc3RpbGwgaW1wb3J0YW50IHRvIGV4cGxvcmUgdGhlIGRhdGEgYXMgd2UncmUgYWJvdXQgdG8gZG8gaGVyZSBhbmQgcG90ZW50aWFsbHkgZmlsdGVyIGZ1cnRoZXIgYmFzZWQgb24geW91ciBvYnNlcnZhdGlvbnMsIGluIHBhcnRpY3VsYXIgc2luY2UgbWFwcGluZyBzb2Z0d2FyZSdzIHF1YWxpdHkgY29udHJvbCBtZWFzdXJlcyAoc3BvaWxlcnMhKSBkb24ndCBhbHdheXMgZmlsdGVyIGJhc2VkIG9uIG1pdG9jaG9uZHJpYWwgZ2VuZSBjb250ZW50LgoKSW4gdGhlIGludHJvLXRvLVItdGlkeXZlcnNlIG1vZHVsZSBub3RlYm9vaywgYDAxLWludHJvLXRvLWJhc2VfUi5SbWRgLCB3ZSBkaXNjdXNzIGJhc2UgUiBvYmplY3QgdHlwZXMsIGJ1dCB0aGVyZSBhcmUgc29tZSAnc3BlY2lhbCcgb2JqZWN0IHR5cGVzIHRoYXQgYXJlIHBhY2thZ2Utc3BlY2lmaWMuCmB0eGltZXRhYCBjcmVhdGVzIGEgYFN1bW1hcml6ZWRFeHBlcmltZW50YCBvYmplY3QgKG9yIG1vcmUgc3BlY2lmaWNhbGx5IGEgYFJhbmdlZFN1bW1hcml6ZWRFeHBlcmltZW50YCBvYmplY3QpLCB3aGljaCBpcyB1c2VkIGJ5IG1hbnkgQmlvY29uZHVjdG9yIHBhY2thZ2VzIHRvIHN0b3JlIGFuZCBwcm9jZXNzIHJlc3VsdHMgZnJvbSBnZW5lIGV4cHJlc3Npb24gc3R1ZGllcy4KCmBgYHtyIHZpZXdfc2NkYXRhLCBsaXZlID0gVFJVRX0KIyBFeHBsb3JlIHRoZSBTdW1tYXJpemVkRXhwZXJpbWVudCBkYXRhCmJsYWRkZXJfc2NlCmBgYAoKVGhlIG1haW4gY29tcG9uZW50IHdlIGFyZSBjb25jZXJuZWQgd2l0aCBmb3Igbm93IGlzIHRoZSBgY291bnRzYCBtYXRyaXgsIHdoaWNoIGlzIHN0b3JlZCBhcyBhbiAiYXNzYXkiLCB3aXRoIGEgcm93IGZvciBlYWNoIGdlbmUgYW5kIGEgY29sdW1uIGZvciBlYWNoIGNlbGwuCkluIHRoaXMgY2FzZSwgd2UgY2FuIHNlZSB0aGVyZSBpcyBpbmZvcm1hdGlvbiBmb3IgMzUsNDI5IGdlbmVzLCBhbmQgQWxldmluIHJlcG9ydHMgZGF0YSBmb3IgMzQ0IGNlbGxzLgoKYHR4aW1ldGFgIGFsc28gYXV0b21hdGljYWxseSBhZGRlZCBzb21lIGFubm90YXRpb24gaW5mb3JtYXRpb24gYWJvdXQgZWFjaCBnZW5lLCB3aGljaCBjYW4gYmUgc2VlbiBieSBleHRyYWN0aW5nIHRoZSBgcm93RGF0YWAgdGFibGUuCgpgYGB7ciB2aWV3X2Fubm90YXRpb24sIGxpdmUgPSBUUlVFfQojIEV4YW1pbmUgcm93IChnZW5lKSBtZXRhZGF0YQpyb3dEYXRhKGJsYWRkZXJfc2NlKQpgYGAKCldlIGNvdWxkIGxlYXZlIHRoZSBvYmplY3QgYXMgaXQgaXMsIGJ1dCB3ZSBjYW4gdW5sb2NrIHNvbWUgZXh0cmEgZnVuY3Rpb25hbGl0eSBieSBjb252ZXJ0aW5nIHRoaXMgZnJvbSBhIGBTdW1tYXJpemVkRXhwZXJpbWVudGAgb2JqZWN0IHRvIGEgYFNpbmdsZUNlbGxFeHBlcmltZW50YCwgc28gd2Ugd2lsbCBnbyBhaGVhZCBhbmQgZG8gdGhhdCBuZXh0LgpgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIG9iamVjdHMgYXJlIGEgc3VidHlwZSBvZiBgU3VtbWFyaXplZEV4cGVyaW1lbnRgIG9iamVjdHMgdGhhdCBhIGxvdCBvZiBzaW5nbGUtY2VsbCBhbmFseXNpcyBSIHBhY2thZ2VzIHVzZSwgc28gd2Ugd2lsbCB0cnkgdG8gZ2V0IGFjcXVhaW50ZWQgd2l0aCB0aGVtLgoKRm9yIG1vcmUgaW5mb3JtYXRpb24gb24gYFNpbmdsZUNlbGxFeHBlcmltZW50YCBvYmplY3RzLCBhcyB3ZWxsIGFzIG1hbnkgb3RoZXIgdG9waWNzIHJlbGF0ZWQgdG8gdGhpcyBjb3Vyc2UsIHdlIGhpZ2hseSByZWNvbW1lbmQgdGhlIGUtYm9vayBbX09yY2hlc3RyYXRpbmcgU2luZ2xlLUNlbGwgQW5hbHlzaXMgd2l0aCBCaW9jb25kdWN0b3JfIChPU0NBKV0oaHR0cDovL2Jpb2NvbmR1Y3Rvci5vcmcvYm9va3MvcmVsZWFzZS9PU0NBLykgYW5kL29yIFtBbWV6cXVpdGEgKmV0IGFsLiogKDIwMjApXShodHRwczovL3d3dy5uYXR1cmUuY29tL2FydGljbGVzL3M0MTU5Mi0wMTktMDY1NC14KS4KCkJlbG93IGlzIGEgZmlndXJlIGZyb20gT1NDQSB0aGF0IHNob3dzIHRoZSBnZW5lcmFsIHN0cnVjdHVyZSBvZiBgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIG9iamVjdHMuCgohW10oZGlhZ3JhbXMvU2luZ2xlQ2VsbEV4cGVyaW1lbnQucG5nKQoKTm90ZSB0aGF0IHRocmVlIGFyZSBzbG90cyBmb3IgcmF3IGRhdGEsIG1ldGFkYXRhIGFib3V0IGNlbGxzLCBtZXRhZGF0YSBhYm91dCBnZW5lcyBvciBmZWF0dXJlcywgYW5kIHNsb3RzIGZvciB2YXJpb3VzIHRyYW5zZm9ybWF0aW9ucyBvZiB0aGUgaW5wdXQgZGF0YS4KTWFueSBvZiB0aGVzZSB3aWxsIG5vdCBiZSBmaWxsZWQgaW4gd2hlbiB3ZSBmaXJzdCBjcmVhdGUgdGhlIG9iamVjdCwgYnV0IGFzIHdlIHByb2NlZWQgdGhyb3VnaCB0aGUgd29ya3Nob3Agd2Ugd2lsbCBhZGQgaW4gbW9yZSBkYXRhIHRvIHRoZXNlIHNsb3RzIGFzIHdlIGNvbXB1dGUgbmV3IHN1bW1hcmllcyBhbmQgdHJhbnNmb3JtYXRpb25zLgoKVG8gcGVyZm9ybSB0aGUgY29udmVyc2lvbiB0byBhIGBTaW5nbGVDZWxsRXhwZXJpbWVudGAsIHdlIHdpbGwgdXNlIHRoZSBSIGZ1bmN0aW9uIGBhcygpYCwgd2hpY2ggImNvZXJjZXMiIG9iamVjdHMgZnJvbSBvbmUgdHlwZSB0byBhbm90aGVyLgoKYGBge3IgY29udmVydF9zY2UsIGxpdmUgPSBUUlVFfQojIENvbnZlcnQgdGhlIFN1bW1hcml6ZWRFeHBlcmltZW50IHRvIGEgU2luZ2xlQ2VsbEV4cGVyaW1lbnQKYmxhZGRlcl9zY2UgPC0gYXMoYmxhZGRlcl9zY2UsICJTaW5nbGVDZWxsRXhwZXJpbWVudCIpCmJsYWRkZXJfc2NlCmBgYAoKRG9pbmcgdGhpcyBhZGRlZCBhIGNvdXBsZSBvZiAoY3VycmVudGx5IGVtcHR5KSBzbG90cyBmb3IgdGhpbmdzIGxpa2UgZGltZW5zaW9uYWxpdHkgcmVkdWN0aW9uIHJlc3VsdHMgYW5kIGFsdGVybmF0aXZlIGZlYXR1cmUgZXhwZXJpbWVudHMuIEZvcmVzaGFkb3dpbmchCgojIyBTdW1tYXJpemluZyBleHByZXNzaW9uCgpGb3IgYSBmaXJzdCBwYXNzIGF0IHRoZSBkYXRhLCB3ZSB3aWxsIGV4dHJhY3QganVzdCB0aGUgY291bnRzIG1hdHJpeCBmcm9tIHRoZSBgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIG9iamVjdCwgYW5kIHVzZSBzb21lIGJhc2UgUiBmdW5jdGlvbnMgdG8gbG9vayBhdCBvdXIgcmVzdWx0cy4KCldlIGNhbiBleHRyYWN0IHRoZSBnZW5lIGJ5IGNlbGwgY291bnQgbWF0cml4IHVzaW5nIHRoZSBgY291bnRzKClgIGZ1bmN0aW9uLgpUaGlzIGFjdHVhbGx5IHJldHVybnMgYSBzcGVjaWFsIGZvcm1hdCBvZiBtYXRyaXggY2FsbGVkIGEgInNwYXJzZSIgbWF0cml4LgpTaW5jZSBzaW5nbGUgY2VsbCBjb3VudCBkYXRhIGlzIG1vc3RseSB6ZXJvcywgdGhpcyBmb3JtYXQgKGEgYGRnQ01hdHJpeGAgb2JqZWN0KSBhbGxvd3MgUiB0byBzYXZlIGEgbG90IG9mIG1lbW9yeS4KVGhpcyBvYmplY3QgdGFrZXMgdXAgYWJvdXQgNi40IE1CLCBidXQgaWYgd2Ugc3RvcmVkIGl0IGluIHRoZSBub3JtYWwgZm9ybWF0LCBpdCB3b3VsZCBiZSBjbG9zZXIgdG8gMTAwIE1CIQpUaGFua2Z1bGx5LCBtb3N0IG9mIHRoZSBmdW5jdGlvbnMgdGhhdCB3ZSB1c2UgdG8gd29yayB3aXRoIHJlZ3VsYXIgbWF0cmljZXMgd29yayBqdXN0IGZpbmUgd2l0aCB0aGVzZSBhcyB3ZWxsLgoKYGBge3IgbWFrZV9tYXRyaXh9CnNjX2NvdW50cyA8LSBjb3VudHMoYmxhZGRlcl9zY2UpCmBgYAoKTGV0J3MgbG9vayBhdCB0aGUgbWVhbiBleHByZXNzaW9uIG9mIHRoZSBnZW5lcyBpbiB0aGlzIGRhdGFzZXQuCldlIHdpbGwgdXNlIGBhcHBseSgpYCBpbiBvcmRlciB0byBjYWxjdWxhdGUgdGhpbmdzIGFjcm9zcyBvdXIgZGF0YSBmcmFtZS4KVGhlIHNlY29uZCBhcmd1bWVudCBpbiBgYXBwbHkoKWAgc3BlY2lmaWVzIHdoZXRoZXIgd2UgYXJlIGNhbGN1bGF0aW5nIGJ5IHJvd3Mgb3IgY29sdW1ucy4KKDEgPSByb3dzLCAyID0gY29sdW1ucykuCgpJbiB0aGUgY29kZSBjaHVuayBiZWxvdywgdXNlIGBhcHBseSgpYCB3aXRoIHRoZSBjb3JyZWN0IGFyZ3VtZW50cyB0byBjYWxjdWxhdGUgdGhlIGdlbmUgbWVhbnMuCgpgYGB7ciBtZWFucywgbGl2ZSA9IFRSVUV9CiMgTGV0J3MgY2FsY3VsYXRlIHRoZSBnZW5lIG1lYW5zIChieSByb3cpCmdlbmVfbWVhbnMgPC0gYXBwbHkoc2NfY291bnRzLCAxLCBtZWFuKQpgYGAKClRoaXMgd29ya3MganVzdCBmaW5lLCBidXQgeW91IG1heSBoYXZlIG5vdGljZWQgaXQgaXMgYSBiaXQgc2xvdy4KRm9yIGEgZmV3IGNvbW1vbiBzdW1tYXJ5IGZ1bmN0aW9ucyBsaWtlIG1lYW5zIGFuZCBzdW1zLCBSIGhhcyBtdWNoIG1vcmUgZWZmaWNpZW50IGZ1bmN0aW9ucyB0byBjYWxjdWxhdGUgYWNyb3NzIHJvd3Mgb3IgY29sdW1ucy4KSW4gdGhpcyBjYXNlLCB3ZSBjYW4gdXNlIGByb3dNZWFucygpYCB0byBkbyB0aGUgc2FtZSBjYWxjdWxhdGlvbiBtdWNoIG1vcmUgcXVpY2tseS4KCgpgYGB7ciByb3dtZWFuc30KIyB1c2Ugcm93TWVhbnMoKSB0byBjYWxjdWxhdGUgZ2VuZSBtZWFucwpnZW5lX21lYW5zIDwtIHJvd01lYW5zKHNjX2NvdW50cykKYGBgCgpMZXQncyBtYWtlIG91ciBmaXJzdCBkZW5zaXR5IHBsb3Qgd2l0aCB0aGVzZSBkYXRhLgpXZSB3aWxsIHVzZSBgZ2dwbG90KClgIGFzIHlvdSBoYXZlIHNlZW4gYmVmb3JlLCBidXQgc2luY2UgdGhlIG9iamVjdCB3ZSB3YW50IHRvIHBsb3QsIGBnZW5lX21lYW5zYCwgaXMgYSB2ZWN0b3Igbm90IGEgZGF0YSBmcmFtZSwgd2Ugd2lsbCBza2lwIHRoZSBgZGF0YWAgYXJndW1lbnQgYW5kIGdvIHN0cmFpZ2h0IHRvIHRoZSBgbWFwcGluZ2AgYWVzdGhldGljcy4KVGhlIHJlbWFpbmRlciBvZiB0aGUgYGdncGxvdGAgY29kZSBzaG91bGQgbG9vayBmYW1pbGlhci4KCmBgYHtyIG1lYW5fZGVuc2l0eX0KIyBQbG90IHRoZSBkZW5zaXR5IG9mIHRoZSBtZWFucyB1c2luZyBnZ3Bsb3QyCmdncGxvdChtYXBwaW5nID0gYWVzKHggPSBnZW5lX21lYW5zKSkgKwogIGdlb21fZGVuc2l0eSgpICsKICBsYWJzKHggPSAiTWVhbiBnZW5lIGNvdW50IikKYGBgCgpUaGF0IHBsb3QgaXMgbm90IHF1aXRlIGFzIGluZm9ybWF0aXZlIGFzIHdlIG1pZ2h0IGxpa2UsIGFzIGEgZmV3IGdlbmVzIHdpdGggaGlnaCBleHByZXNzaW9uIGFyZSBtYWtpbmcgdGhlIHNjYWxlIGp1c3QgYSAqYml0KiB3aWRlLgpMZXRzIHpvb20gaW4gb24gdGhlIGxlZnQgcGFydCBvZiB0aGUgZ3JhcGggYnkgYWRkaW5nIGFuIGB4bGltKClgIGFyZ3VtZW50LgooTm90ZSB0aGF0IGB4bGltKClgIHdpbGwgcmVtb3ZlIHBvaW50cyBvdXRzaWRlIHRoZSBzcGVjaWZpZWQgcmFuZ2UsIHNvIHlvdSB3aWxsIGdldCBhIHdhcm5pbmcuKQoKYGBge3Igem9vbV9kZW5zaXR5LCBsaXZlID0gVFJVRX0KIyBQbG90IHRoZSBkZW5zaXR5IG9mIHRoZSBtZWFucyB1c2luZyBnZ3Bsb3QyCmdncGxvdChtYXBwaW5nID0gYWVzKHggPSBnZW5lX21lYW5zKSkgKwogIGdlb21fZGVuc2l0eSgpICsKICBsYWJzKHggPSAiTWVhbiBnZW5lIGNvdW50IikgKwogIHhsaW0oMCwgNSkKYGBgCgpFdmVuIGFzIHdlIHpvb20gaW4sIHRoZSBjb3VudHMgZGF0YSBoYXMgbWFueSB6ZXJvZXMsIHdoaWNoIHdlIGFjdHVhbGx5IGV4cGVjdCBpbiBhIHNpbmdsZSBjZWxsIFJOQS1zZXEgZXhwZXJpbWVudC4KCkxldCdzIGNhbGN1bGF0ZSB3aGF0IHByb3BvcnRpb24gb2YgdGhlIGNvdW50IGRhdGEgaXMgemVyb3M6CgpgYGB7ciB6ZXJvX2ZyYWN0aW9uLCBsaXZlID0gVFJVRX0Kc3VtKHNjX2NvdW50cyA9PSAwKS8obnJvdyhzY19jb3VudHMpICogbmNvbChzY19jb3VudHMpKQpgYGAKCgojIyBRdWFsaXR5IGNvbnRyb2wgbWVhc3VyZXMgZm9yIHRoZSBjb3VudHMgbWF0cml4CgpUaGUgc21hbGwgYW1vdW50IG9mIFJOQSBpbiBhIHNpbmdsZSBjZWxsIHJlc3VsdHMgaW4gaGlnaGVyIGNoYW5jZXMgb2YgZXJyb3JzIGFuZCBiaWFzZXMgaW4gUk5BIGlzb2xhdGlvbiwgYW1wbGlmaWNhdGlvbiwgYW5kIHNlcXVlbmNpbmcuCldlIHNob3VsZCBjaGVjayB0aGF0IHRoZSBvdmVyYWxsIGRhdGEgd2Ugb2JzZXJ2ZSBmb3IgZWFjaCBzYW1wbGUvY2VsbCBhcmUgcmVhc29uYWJsZSBiZWZvcmUgcHJvY2VlZGluZyB0b28gZmFyLgoKVGhlIG5leHQgc2VjdGlvbiBleHBsb3JlcyBzb21lIG9mIHRoZSB3YXlzIHdlIGNhbiBmaWx0ZXIgdGhlIGRhdGEgc2V0IHRvIGNsZWFuIHRoaW5ncyB1cCBiZWZvcmUgd2UgY29udGludWUgdG8gZG93bnN0cmVhbSBhbmFseXNpcy4KCiFbUUMgYW5kIGZpbHRlcmluZ10oZGlhZ3JhbXMvcm9hZG1hcF9zaW5nbGVfcWNfbm9ybV9hbGV2aW4ucG5nKQoKIyMjIyBUb3RhbCBjb3VudHMgYXMgYSBxdWFsaXR5IG1lYXN1cmUKCkZpcnN0LCBsZXRzIGxvb2sgYXQgdGhlIHRvdGFsIG51bWJlciBvZiBjb3VudHMgcGVyIGNlbGwsIGFjcm9zcyBhbGwgZ2VuZXMuCkZvciB0aGlzIHdlIHdpbGwgdXNlIGBjb2xTdW1zKClgLCBhcyBlYWNoIGNvbHVtbiByZXByZXNlbnRzIGEgZGlmZmVyZW50IHNhbXBsZWQgY2VsbC4KCmBgYHtyIHRvdGFsX2NvdW50cywgbGl2ZSA9IFRSVUV9CiMgTWFrZSBhIHZlY3RvciBvZiB0b3RhbF9jb3VudHMgbnVtYmVyIG9mIGNvdW50cyBwZXIgc2FtcGxlIHVzaW5nIGNvbFN1bXMoKQp0b3RhbF9jb3VudHMgPC0gY29sU3VtcyhzY19jb3VudHMpCmBgYAoKCmBgYHtyIGNvdW50c19zdW1tYXJ5LCBsaXZlID0gVFJVRX0KIyBUYWtlIGEgbG9vayBhdCB0aGUgc3VtbWFyeSBzdGF0aXN0aWNzIGZvciB0aGUgdG90YWwgY291bnRzCnN1bW1hcnkodG90YWxfY291bnRzKQpgYGAKCllpa2VzLCBhdCBsZWFzdCBvbmUgb2YgdGhlIGNlbGxzIGhhcyBvbmx5IDEgcmVhZCEsIGNvbXBhcmVkIHRvIHRoZSBtZWRpYW4gb2YgfjQwMDAhCkl0J3MgaGlnaGx5IGxpa2VseSB0aGF0IHRoaXMgJ2NlbGwnIGlzIGVpdGhlciBhbiBlbXB0eSB3ZWxsIG9yIGRpZCBub3QgZ2V0IHNlcXVlbmNlZCBwcm9wZXJseS4KCkxldCdzIHZpc3VhbGl6ZSB0aGUgZGlzdHJpYnV0aW9uIG9mIHRvdGFsIGNvdW50cyB0byBzZWUgaWYgdGhpcyBpcyB0aGUgb25seSBjZWxsIHdlIG1pZ2h0IHdhbnQgdG8gZXhjbHVkZS4KCkluIGZvbGxvd2luZyBncmFwaHMsIHdlIHdpbGwgdXNlIHZlcnRpY2FsIHJlZCBsaW5lcyB0byBpbmRpY2F0ZSBwb3NzaWJsZSBjdXRvZmZzLgoKYGBge3IgdG90YWxfY291bnRzX3Bsb3QsIGxpdmUgPSBUUlVFfQojIExldCdzIHVzZSB0aGUgc2FtZSBraW5kIG9mIHBsb3QgYXMgYWJvdmUgYnV0IGFkZCBtb3JlIGxheWVycwpnZ3Bsb3QobWFwcGluZyA9IGFlcyh4ID0gdG90YWxfY291bnRzKSkgKwogIGdlb21fZGVuc2l0eShmaWxsID0gImxpZ2h0Ymx1ZSIpICsKICBnZW9tX3ZsaW5lKHhpbnRlcmNlcHQgPSAxMDAwLCBjb2xvciA9ICJyZWQiKSArCiAgbGFicyh4ID0gIkNvdW50cyBwZXIgY2VsbCIpCmBgYAoKSG93IG1hbnkgY2VsbHMgd291bGQgYmUgcmVtb3ZlZCB3aXRoIHRoaXMgKG9yIG90aGVyIGN1dG9mZnMpIGZvciBjb3VudHMgcGVyIHNhbXBsZT8KCmBgYHtyIGNvdW50X2N1dG9mZnN9CiMgQ2FsY3VsYXRlIHRoZSBudW1iZXIgb2YgY2VsbHMgdGhhdCB3b3VsZCBiZSByZW1vdmVkIHdpdGggYSBnaXZlbiBjdXRvZmYKY291bnRfY3V0b2ZmIDwtIDEwMDAKc3VtKHRvdGFsX2NvdW50cyA8PSBjb3VudF9jdXRvZmYpCmBgYAoKCiMjIyBOdW1iZXIgb2YgZ2VuZXMgYSBjZWxsIGV4cHJlc3NlZCBhcyBhIHF1YWxpdHkgbWVhc3VyZQoKV2hhdCBpZiBhIHNpbmdsZSBnZW5lIGFjY291bnRlZCBmb3IgYWxsIGNvdW50cyBpbiBhIHBhcnRpY3VsYXIgY2VsbD8KVGhpcyBjZWxsIHdvdWxkIG5vdCBoYXZlIGhlbHBmdWwgZGF0YSBmb3IgdXMsIHNvIHdlIHNob3VsZCBsb29rIHRvIHJlbW92ZSBhbnkgY2VsbHMgd2Ugc3VzcGVjdCBtaWdodCBub3QgaGF2ZSBhIHVzZWZ1bCBhbW91bnQgb2YgaXRzIHRyYW5zY3JpcHRvbWUgbWVhc3VyZWQuCgpCdXQgYmVmb3JlIHdlIGNhbiBkZXRlcm1pbmUgaG93IG1hbnkgZ2VuZXMgd2UgY29uc2lkZXIgYSBwYXJ0aWN1bGFyIGNlbGwgdG8gYmUgZXhwcmVzc2luZyB3ZSBuZWVkIHRvIGRldGVybWluZSBhIG51bWVyaWMgY3V0b2ZmIGZvciB3aGF0IHdlIGNvbnNpZGVyIHRvIGJlIGEgZGV0ZWN0ZWQgZ2VuZS4KSG93IG1hbnkgY291bnRzIG11c3QgdGhlcmUgYmUgZm9yIHlvdSB0byBjb25zaWRlciBhIGdlbmUgZXhwcmVzc2VkPwpIZXJlIGxldCdzIGdvIGZvciBhIHNpbXBsZSBkZXRlY3Rpb24gY3V0b2ZmIG9mID4gMC4KCmBgYHtyIGRldGVjdGlvbl9tYXRyaXgsIGxpdmU9VFJVRX0KIyBtYWtlIGEgZGV0ZWN0aW9uX21hdCBtYXRyaXggdGhhdCBpcyBUUlVFIHdoZW4gYSBnZW5lIGlzIGV4cHJlc3NlZCBpbiBhIHNhbXBsZQpkZXRlY3Rpb25fbWF0IDwtIHNjX2NvdW50cyA+IDAKYGBgCgpOb3cgdGhhdCB3ZSBoYXZlIHR1cm5lZCBvdXIgZGF0YSBpbnRvIGEgbWF0cml4IG9mIGBUUlVFL0ZBTFNFYCBmb3IgZGV0ZWN0aW9uLCB3ZSBjYW4gc3VtIHRoaXMgZGF0YSBieSBjb2x1bW4gdG8gZWZmZWN0aXZlbHkgZ2V0IGEgdmVjdG9yIG9mIGhvdyBtYW55IGdlbmVzIHdlcmUgbWVhc3VyZWQgaW4gZWFjaCBjZWxsLgoKYGBge3IgZ2VuZXNfZXhwcmVzc2VkLCBsaXZlID0gVFJVRX0KIyBNYWtlIGEgdmVjdG9yIHRoYXQgY29udGFpbnMgdGhlIG51bWJlciBvZiBnZW5lcyBleHByZXNzZWQgYnkgYSBwYXJ0aWN1bGFyIGNlbGwKbnVtX2dlbmVzX2V4cCA8LSBjb2xTdW1zKGRldGVjdGlvbl9tYXQpCmBgYAoKTGV0J3MgcGxvdCB0aGlzIHVzaW5nIHRoZSBzYW1lIHN0eWxlIGFuZCB0eXBlIG9mIGdyYXBoIGFzIGFib3ZlLgoKYGBge3IgZ2VuZXNfZXhwcmVzc2VkX3Bsb3R9CmdncGxvdChtYXBwaW5nID0gYWVzKHggPSBudW1fZ2VuZXNfZXhwKSkgKwogIGdlb21fZGVuc2l0eShmaWxsID0gImxpZ2h0Ymx1ZSIpICsKICBsYWJzKHggPSAiTnVtYmVyIG9mIGdlbmVzIGV4cHJlc3NlZCIpICsKICB0aGVtZV9jbGFzc2ljKCkKYGBgCgpUaGlzIHBsb3QgaGVscHMgdXMgdmlzdWFsaXplIHRoZSBkaXN0cmlidXRpb24gb2YgZ2VuZXMgcGVyIGNlbGwgYW5kIGNhbiBoZWxwIGluZm9ybSBob3cgd2UgY2hvb3NlIHRoZSBjdXRvZmYuCkl0J3MgaW1wb3J0YW50IHRvIHJlbWVtYmVyIHRoYXQgZGlmZmVyZW50IGNlbGwgdHlwZXMgY2FuIGhhdmUgcXVpdGUgZGlmZmVyZW50IHBhdHRlcm5zIHdpdGggcmVnYXJkcyB0byBudW1iZXIgb2YgZ2VuZXMgZXhwcmVzc2VkLgpJZiB3ZSB3ZXJlIHRvIHVzZSBzdHJpY3QgY3V0b2ZmcyB0byBzZWxlY3Qgd2hpY2ggY2VsbHMgYXJlICJ2YWxpZCIsIHRoZXJlIGlzIHRoZSBwb3NzaWJpbGl0eSB0aGF0IHdlIGNvdWxkIGJpYXMgb3VyIHJlc3VsdHMsIHNvIHRoaXMgaXMgc29tZXRoaW5nIHdlIHdhbnQgdG8gYmUgY2FyZWZ1bCBhYm91dC4KCkxldCdzIHNlZSB3aGF0IGhhcHBlbnMgaWYgd2Ugb25seSBrZWVwIGNlbGxzIHdpdGggPiA1MDAgZXhwcmVzc2VkIGdlbmVzLgpKdXN0IGxpa2Ugd2hlbiB3ZSBsb29rZWQgYXQgdG90YWwgY291bnRzLCB3ZSBjYW4gYWRkIGluIGEgdmVydGljYWwgbGluZSB0byB0aGUgcHJldmlvdXMgcGxvdCB3aGVyZSB0aGUgcG9zc2libGUgY3V0b2ZmIHdvdWxkIGJlLgoKYGBge3IgZ2VuZXNfZXhwcmVzc2VkX2N1dG9mZiwgbGl2ZSA9IFRSVUV9CmdncGxvdChtYXBwaW5nID0gYWVzKHggPSBudW1fZ2VuZXNfZXhwKSkgKwogIGdlb21fZGVuc2l0eShmaWxsID0gImxpZ2h0Ymx1ZSIpICsKICBsYWJzKHggPSAiTnVtYmVyIG9mIGdlbmVzIGV4cHJlc3NlZCIpICsKICB0aGVtZV9jbGFzc2ljKCkgKwogIGdlb21fdmxpbmUoeGludGVyY2VwdCA9IDUwMCwgY29sb3IgPSAicmVkIikKYGBgCkhvdyBtYW55IGNlbGxzIHdvdWxkIGJlIHJlbW92ZWQgd2l0aCB0aGlzIGN1dG9mZj8KCmBgYHtyIGNvdW50X2dlbmVfY3V0b2ZmcywgbGl2ZSA9IFRSVUV9CiMgQ2FsY3VsYXRlIHRoZSBudW1iZXIgb2YgY2VsbHMgdGhhdCB3b3VsZCBiZSByZW1vdmVkIHdpdGggYSBnaXZlbiBjdXRvZmYKZ2VuZV9jdXRvZmYgPC0gNTAwCnN1bShudW1fZ2VuZXNfZXhwIDw9IGdlbmVfY3V0b2ZmKQpgYGAKCiMjIyBNaXRvY2hvbmRyaWFsIGdlbmUgZXhwcmVzc2lvbgoKSWYgYSBjZWxsIGlzIGRlYWQgb3IgZHlpbmcsIGl0cyBtUk5BIHdpbGwgdGVuZCB0byBsZWFrIG91dCBvZiB0aGUgY2VsbCwgbGVhdmluZyBhbiBvdmVyYWJ1bmRhbmNlIG9mIG1pdG9jaG9uZHJpYWwgUk5BLCB3aGljaCBpcyBtb3JlIGxpa2VseSB0byBzdGF5IHdpdGhpbiB0aGUgbWl0b2Nob25kcmlhIGxvbmdlci4KVG8gbG9vayBmb3IgdGhpcywgd2Ugd291bGQgbGlrZSB0byBjYWxjdWxhdGUgdGhlIGZyYWN0aW9uIG9mIG1pdG9jaG9uZHJpYWwgZXhwcmVzc2lvbiBmb3IgZWFjaCBjZWxsIGFzIHdlbGwuCkZpcnN0LCB3ZSB3aWxsIG5lZWQgYSBsaXN0IG9mIHRoZSBtaXRvY2hvbmRyaWFsIGdlbmVzLCB3aGljaCB3ZSBoYXZlIHByZXBhcmVkIGluIGEgdHN2IGZpbGUgYG1tX21pdG9jaG9uZHJpYWxfZ2VuZXMudHN2YCB0aGF0IHdlIHdpbGwgbm93IHJlYWQgaW4sIGFuZCBmaWx0ZXIgdG8ganVzdCB0aGUgZ2VuZXMgdGhhdCBhcmUgZm91bmQgaW4gdGhlIGRhdGEgc2V0LgoKCmBgYHtyIHJlYWRfbWl0b30KIyByZWFkIGBtbV9taXRvY2hvbmRyaWFsX2dlbmVzLnRzdmAgZnJvbSByZWZfZGlyIGFuZAojIGNyZWF0ZSBmcm9tIGl0IGEgc2luZ2xlIHZlY3RvciBjb250YWluaW5nIG9ubHkgdGhlIGdlbmUgaWRzCm1pdG9fZ2VuZXMgPC0gcmVhZHI6OnJlYWRfdHN2KG1pdG9fZmlsZSkgfD4KICAjIGZpbHRlciB0byBvbmx5IGdlbmUgaW4gdGhlIHNjZSBvYmplY3QKICBkcGx5cjo6ZmlsdGVyKGdlbmVfaWQgJWluJSByb3duYW1lcyhibGFkZGVyX3NjZSkpIHw+CiAgIyBwdWxsIHRha2VzIHRoaXMgY29sdW1uIG91dCBvZiB0aGUgZGF0YSBmcmFtZSBhcyBhIHN0YW5kLWFsb25lIHZlY3RvcgogIGRwbHlyOjpwdWxsKGdlbmVfaWQpCmBgYAoKTm93IHdlIGNhbiB1c2UgdGhlIGdlbmVzIGZyb20gdGhhdCBsaXN0IHRvIHNlbGVjdCBvbmx5IHRoZSByb3dzIG9mIHRoZSBjb3VudCBtYXRyaXggdGhhdCBjb3JyZXNwb25kIHRvIHRoZSBtaXRvY2hvbmRyaWFsIGdlbmVzIGFuZCBzdW0gdGhlaXIgZXhwcmVzc2lvbiBmb3IgZWFjaCBzYW1wbGUuCgpgYGB7ciBtaXRvX2ZpbHRlciwgbGl2ZSA9IFRSVUV9CiMgY3JlYXRlIGEgbWl0b19yb3dzIHZlY3RvciB0aGF0IGlzIFRSVUUgZm9yIG1pdG9jaG9uZHJpYWwgZ2VuZXMgaW4gb3VyIGRhdGFzZXQKbWl0b19yb3dzIDwtIHJvd25hbWVzKHNjX2NvdW50cykgJWluJSBtaXRvX2dlbmVzCgojIHN1bSB0aGUgY291bnRzIGZyb20ganVzdCB0aG9zZSBnZW5lcyBmb3IgYWxsIHNhbXBsZXMKbWl0b19jb3VudHMgPC0gY29sU3VtcyhzY19jb3VudHNbbWl0b19yb3dzLCBdKQoKIyBjYWxjdWxhdGUgbWl0b19mcmFjdGlvbiBmb3IgYWxsIHNhbXBsZXMKbWl0b19mcmFjdGlvbiA8LSBtaXRvX2NvdW50cy90b3RhbF9jb3VudHMKYGBgCgpMZXRzIG1ha2UgYSBwbG90IG9mIHRoaXMgZGlzdHJpYnV0aW9uIGFzIHdlbGwhCgpgYGB7ciBwbG90X21pdG8sIGxpdmUgPSBUUlVFfQpnZ3Bsb3QobWFwcGluZyA9IGFlcyh4ID0gbWl0b19mcmFjdGlvbikpICsKICBnZW9tX2RlbnNpdHkoZmlsbCA9ICJsaWdodGJsdWUiKSArCiAgbGFicyh4ID0gIk1pdGNob25kcmlhbCBmcmFjdGlvbiIpICsKICBnZW9tX3ZsaW5lKHhpbnRlcmNlcHQgPSAwLjIsIGNvbG9yID0gInJlZCIpICsKICB0aGVtZV9jbGFzc2ljKCkKYGBgCkhlcmUsIHdlIHdhbnQgdG8ga2VlcCBjZWxscyB3aXRoIGEgbG93IGZyYWN0aW9uIG9mIHJlYWRzIGNvcnJlc3BvbmRpbmcgdG8gbWl0b2Nob25kcmlhbCBnZW5lcyBhbmQgcmVtb3ZlIGFueSBjZWxscyB3aXRoIGEgaGlnaCBtaXRvY2hvbmRyaWFsIGZyYWN0aW9uLgpBZ2FpbiwgaXQncyBpbXBvcnRhbnQgdG8gdGFrZSB0aGlzIHN0ZXAgZXZlbiBpZiB5b3Ugc3RhcnRlZCB3aXRoIGZpbHRlcmVkIGRhdGEsIHNpbmNlIG1hcHBpbmcgc29mdHdhcmUgbGlrZSBgc2FsbW9uIGFsZXZpbmAgYW5kIENlbGwgUmFuZ2VyIGRvIG5vdCB1c3VhbGx5IGNvbnNpZGVyIG1pdG9jaG9uZHJpYWwgcmVhZCBwZXJjZW50YWdlcyB3aGVuIGZpbHRlcmluZy4KCiMjIyBDb21iaW5pbmcgc2FtcGxlIFFDIG1lYXN1cmVzCgpMZXRzIHB1dCBhbGwgb2YgdGhlIFFDIG1lYXN1cmVzIHdlIGhhdmUgY2FsY3VsYXRlZCBpbnRvIGEgc2luZ2xlIGRhdGEgZnJhbWUsIHNvIHdlIGNhbiBsb29rIGF0IGhvdyB0aGV5IG1pZ2h0IHJlbGF0ZSB0byBvbmUgYW5vdGhlci4KCmBgYHtyIHFjX2RhdGFmcmFtZSwgbGl2ZSA9IFRSVUV9CiMgbWFrZSBhIGRhdGEgZnJhbWUgd2l0aCBudW1iZXIgb2YgZ2VuZXMgZXhwcmVzc2VkLCB0b3RhbCBjb3VudHMsIGFuZCBtaXRvIGZyYWN0aW9uCnFjX2RmIDwtIGRhdGEuZnJhbWUoYmFyY29kZSA9IG5hbWVzKG51bV9nZW5lc19leHApLAogICAgICAgICAgICAgICAgICAgIGdlbmVzX2V4cCA9IG51bV9nZW5lc19leHAsCiAgICAgICAgICAgICAgICAgICAgdG90YWxfY291bnRzID0gdG90YWxfY291bnRzLAogICAgICAgICAgICAgICAgICAgIG1pdG9fZnJhY3Rpb24gPSBtaXRvX2ZyYWN0aW9uKQoKYGBgCgpOb3cgd2UgY2FuIHBsb3QgdGhlc2UgbWVhc3VyZXMgYWxsIHRvZ2V0aGVyLCBhbG9uZyB3aXRoIHNvbWUgcG9zc2libGUgY3V0b2Zmcy4KCmBgYHtyIHFjX3NjYXR0ZXJwbG90fQpnZ3Bsb3QocWNfZGYsIGFlcyAoeCA9IHRvdGFsX2NvdW50cywKICAgICAgICAgICAgICAgICAgIHkgPSBnZW5lc19leHAsCiAgICAgICAgICAgICAgICAgICBjb2xvciA9IG1pdG9fZnJhY3Rpb24pKSArCiAgZ2VvbV9wb2ludChhbHBoYSA9IDAuNSkgKwogIHNjYWxlX2NvbG9yX3ZpcmlkaXNfYygpICsKICBnZW9tX3ZsaW5lKHhpbnRlcmNlcHQgPSAxMDAwLCBjb2xvciA9ICJyZWQiKSArCiAgZ2VvbV9obGluZSh5aW50ZXJjZXB0ID0gNTAwLCBjb2xvciA9ICJyZWQiKSArCiAgbGFicyh4ID0gIlRvdGFsIENvdW50IiwKICAgICAgIHkgPSAiTnVtYmVyIG9mIEdlbmVzIEV4cHJlc3NlZCIsCiAgICAgICBjb2xvciA9ICJNaXRvY2hvbmRyaWFsXG5GcmFjdGlvbiIpICsKICB0aGVtZV9idygpCmBgYAoKSWYgd2Ugd2FudCB0byBmaWx0ZXIgb3VyIGRhdGEgYmFzZWQgb24gdGhlc2UgbWVhc3VyZXMgYW5kIGN1dG9mZnMgd2UgbGlrZSwgd2UgY2FuIGRvIHRoaXMgd2l0aCBgZHBseXI6OmZpbHRlcigpYCBhbmQgdGhlbiBzZWxlY3QgdGhlIHJlc3VsdGluZyBjb2x1bW5zIGZyb20gdGhlIG1hdHJpeC4KCmBgYHtyIHFjX2ZpbHRlciwgbGl2ZSA9IFRSVUV9CiMgY3JlYXRlIGEgZmlsdGVyZWRfc2FtcGxlcyBkYXRhIGZyYW1lIGZyb20gcWNfZGYKZmlsdGVyZWRfc2FtcGxlcyA8LSBxY19kZiB8PgogIGRwbHlyOjpmaWx0ZXIodG90YWxfY291bnRzID4gMTAwMCwKICAgICAgICAgICAgICAgIGdlbmVzX2V4cCA+IDUwMCwKICAgICAgICAgICAgICAgIG1pdG9fZnJhY3Rpb24gPCAwLjIpCiMgc2VsZWN0IG9ubHkgcGFzc2luZyBzYW1wbGVzIGZvciBibGFkZGVyX3NjZV9maWx0ZXJlZApzY19jb3VudHNfZmlsdGVyZWQgPC0gc2NfY291bnRzWywgZmlsdGVyZWRfc2FtcGxlcyRiYXJjb2RlXQpgYGAKCiMjIEZpbHRlcmluZyB0aGUgYFNpbmdsZUNlbGxFeHBlcmltZW50YCBkaXJlY3RseQoKIyMjIENhbGN1bGF0aW5nIGNlbGwgUUMgc3RhdHMgd2l0aCBgc2NhdGVyYAoKVGhlIG1ldGhvZHMgYWJvdmUgd2VyZSBuaWNlIGZvciBkZW1vbnN0cmF0aW5nIHRoZSBraW5kcyBvZiBmaWx0ZXJpbmcgd2UgbWlnaHQgZG8sIGJ1dCBhbGwgdGhlIHN0ZXBzIHdvdWxkIGNlcnRhaW5seSBiZSByZXBldGl0aXZlIGlmIHdlIGhhZCB0byBkbyB0aGVtIGZvciBlYWNoIHNhbXBsZS4KVGhhbmtmdWxseSwgdGhlcmUgYXJlIHNvbWUgbmljZSBtZXRob2RzIHRoYXQgaGF2ZSBiZWVuIGRldmVsb3BlZCBpbiBwYWNrYWdlcyBsaWtlIGBzY2F0ZXJgIHRvIHBlcmZvcm0gdGhlbSBhbGwgYXQgb25jZSBhbmQgYWRkIHRoZSByZXN1bHRzIHRvIHRoZSBgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIG9iamVjdC4KVGhlIGFkdmFudGFnZXMgb2YgdXNpbmcgZnVuY3Rpb25zIGxpa2UgdGhpcyBhcmUgdGhhdCB3ZSBjYW4ga2VlcCBhbGwgb2YgdGhlIG1ldGFkYXRhIHRvZ2V0aGVyLCBmaWx0ZXIgZGlyZWN0bHkgb24gdGhlIG9iamVjdCBvZiBpbnRlcmVzdCwgYXZvaWQgYSBsb3Qgb2YgcmVwZXRpdGlvbiwgYW5kIGluIGRvaW5nIHNvIGF2b2lkIG1hbnkgcG90ZW50aWFsIGVycm9ycy4KCldlIHdpbGwgc3RhcnQgd2l0aCB0aGUgZnVuY3Rpb24gYGFkZFBlckNlbGxRQygpYCwgd2hpY2ggdGFrZXMgYSBgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIGFuZCBhIGxpc3Qgb2YgZ2VuZSBzZXRzIHRoYXQgdGhhdCB3ZSBtaWdodCB3YW50IHRvIGNhbGN1bGF0ZSBzdWJzZXQgaW5mb3JtYXRpb24gZm9yLgpJbiBvdXIgY2FzZSwgd2Ugd2lsbCBqdXN0IGxvb2sgYXQgbWl0b2Nob25kcmlhbCBnZW5lcyBhZ2Fpbi4KCmBgYHtyfQpibGFkZGVyX3NjZSA8LSBzY2F0ZXI6OmFkZFBlckNlbGxRQygKICBibGFkZGVyX3NjZSwKICAjIGEgbGlzdCBvZiBuYW1lZCBnZW5lIHN1YnNldHMgdGhhdCB3ZSB3YW50IHN0YXRzIGZvcgogICMgaGVyZSB3ZSBhcmUgdXNpbmcgbWl0b2Nob25kcmlhbCBnZW5lcwogIHN1YnNldHMgPSBsaXN0KG1pdG8gPSBtaXRvX2dlbmVzKQogICkKYGBgCgpUaGUgcmVzdWx0cyBvZiB0aGVzZSBjYWxjdWxhdGlvbnMgYXJlIG5vdyBzdG9yZWQgYXMgYSBkYXRhIGZyYW1lIGluIHRoZSBgY29sRGF0YWAgc2xvdCBvZiB0aGUgYFNpbmdsZUNlbGxFeHBlcmltZW50YCBvYmplY3QsIHdoaWNoIHdlIGNhbiBwdWxsIG91dCB3aXRoIHRoZSBgY29sRGF0YSgpYCBmdW5jdGlvbi4KKFVuZm9ydHVuYXRlbHksIGl0IGlzIG5vdCBxdWl0ZSBhIHJlZ3VsYXIgZGF0YSBmcmFtZSwgYnV0IHdlIGNhbiBlYXNpbHkgY29udmVydCBpdCB0byBvbmUuKQpFdmVuIG5pY2VyLCB3ZSBjYW4gYWNjZXNzIHRoZSBRQyBkYXRhIGluIHRob3NlIGNvbHVtbnMgZGlyZWN0bHkgd2l0aCBqdXN0IHRoZSBmYW1pbGlhciBgJGAgc3ludGF4IQoKVGhlIGNhbGN1bGF0ZWQgc3RhdGlzdGljcyBpbmNsdWRlIGBzdW1gLCB0aGUgdG90YWwgVU1JIGNvdW50IGZvciB0aGUgY2VsbCwgYGRldGVjdGVkYCwgdGhlIG51bWJlciBvZiBnZW5lcyBkZXRlY3RlZCwgYW5kIGEgZmV3IGRpZmZlcmVudCBzdGF0aXN0aWNzIGZvciBlYWNoIHN1YnNldCB0aGF0IHdlIGdhdmUsIGluY2x1ZGluZyB0aGUgcGVyY2VudCAobm90IGZyYWN0aW9uISkgb2YgYWxsIFVNSXMgZnJvbSB0aGUgc3Vic2V0LgpTaW5jZSB0aGUgc3Vic2V0IHdlIHVzZWQgd2FzIG5hbWVkIGBtaXRvYCwgdGhpcyBjb2x1bW4gaXMgY2FsbGVkIGBzdWJzZXRzX21pdG9fcGVyY2VudGAuCgpVc2luZyB0aGVzZSwgd2UgY2FuIHJlY3JlYXRlIHRoZSBwbG90IGZyb20gYmVmb3JlOgoKYGBge3IgcmVwbG90fQojIGV4dHJhY3QgdGhlIGNvbHVtbiBkYXRhIGFuZCBjb252ZXJ0IHRvIGEgZGF0YSBmcmFtZQpibGFkZGVyX3FjIDwtIGRhdGEuZnJhbWUoY29sRGF0YShibGFkZGVyX3NjZSkpCgojIHBsb3Qgd2l0aCB0aGUgcWMgZGF0YSBmcmFtZQpnZ3Bsb3QoYmxhZGRlcl9xYywgYWVzICh4ID0gc3VtLAogICAgICAgICAgICAgICAgICAgICAgICB5ID0gZGV0ZWN0ZWQsCiAgICAgICAgICAgICAgICAgICAgICAgY29sb3IgPSBzdWJzZXRzX21pdG9fcGVyY2VudCkpICsKICBnZW9tX3BvaW50KGFscGhhID0gMC41KSArCiAgc2NhbGVfY29sb3JfdmlyaWRpc19jKCkgKwogIGxhYnMoeCA9ICJUb3RhbCBDb3VudCIsCiAgICAgICB5ID0gIk51bWJlciBvZiBHZW5lcyBFeHByZXNzZWQiLAogICAgICAgY29sb3IgPSAiTWl0b2Nob25kcmlhbFxuRnJhY3Rpb24iKSArCiAgdGhlbWVfYncoKQpgYGAKCiMjIyBBcHBseWluZyBhIGZpbHRlciB0byBhIGBTaW5nbGVDZWxsRXhwZXJpbWVudGAKCkZpbHRlcmluZyB0aGUgYFNpbmdsZUNlbGxFeHBlcmltZW50YCBvYmplY3QgaXMgZG9uZSBhcyBpZiBpdCB3ZXJlIGp1c3QgdGhlIGNvdW50cyBtYXRyaXgsIHdpdGggYnJhY2tldHMgYW5kIGluZGV4ZXMuCldoaWxlIHRoaXMgd2lsbCBsb29rIG11Y2ggbGlrZSB3aGF0IHdlIGRpZCBiZWZvcmUsIGl0IGlzIGJldHRlciwgYmVjYXVzZSBpdCB3aWxsIGFsc28ga2VlcCB0aGUgZmlsdGVyZWQgUUMgc3RhdHMgYWxvbmdzaWRlLCBpbiBjYXNlIHdlIHdhbnRlZCB0byByZXZpc2l0IHRoZW0gbGF0ZXIuCk90aGVyd2lzZSwgd2Ugd291bGQgaGF2ZSB0byBmaWx0ZXIgb3VyIFFDIHJlc3VsdHMgc2VwYXJhdGVseSwgd2hpY2ggaXMgYW4gZWFzeSBwbGFjZSBmb3IgZXJyb3JzIHRvIGNyZWVwIGluLgoKYGBge3IgZmlsdGVyX3NjZX0KIyBjcmVhdGUgYSBib29sZWFuIHZlY3RvciBvZiBRQyBmaWx0ZXJzCmNlbGxzX3RvX2tlZXAgPC0gYmxhZGRlcl9zY2Ukc3VtID4gMTAwMCAmCiAgYmxhZGRlcl9zY2UkZGV0ZWN0ZWQgPiA1MDAgJgogIGJsYWRkZXJfc2NlJHN1YnNldHNfbWl0b19wZXJjZW50IDwgMjAKCiMgZmlsdGVyIHRoZSBzY2Ugb2JqZWN0IChjZWxscyBhcmUgY29sdW1ucykKYmxhZGRlcl9zY2VfZmlsdGVyZWQgPC0gYmxhZGRlcl9zY2VbLCBjZWxsc190b19rZWVwXQpgYGAKCkp1c3QgdG8gY2hlY2ssIHdlIHNob3VsZCBoYXZlIHRoZSBzYW1lIG51bWJlciBvZiBjZWxscyBpbiBgYmxhZGRlcl9zY2VfZmlsdGVyZWRgIGFzIG91ciBwcmV2aW91cyBgc2NfY291bnRzX2ZpbHRlcmVkYC4KCmBgYHtyIGNoZWNrX2NlbGxfY291bnQsIGxpdmUgPSBUUlVFfQpuY29sKHNjX2NvdW50c19maWx0ZXJlZCkgPT0gbmNvbChibGFkZGVyX3NjZV9maWx0ZXJlZCkKYGBgCgojIyBOdW1iZXIgb2YgY2VsbHMgdGhhdCBleHByZXNzIGEgZ2VuZSBhcyBhIHF1YWxpdHkgbWVhc3VyZQoKTm93IHdlIGhhdmUgYW4gaWRlYSBvZiB3aGF0IGNlbGxzIHdlIHByb2JhYmx5IHdhbnQgdG8gZ2V0IHJpZCBvZi4KQnV0IHdoYXQgaWYgb3VyIGRhdGEgY29udGFpbnMgZ2VuZXMgdGhhdCB3ZSBjYW4ndCByZWxpYWJseSBtZWFzdXJlIGluIHRoZXNlIGNlbGxzPwoKV2UgY291bGQgdXNlIG91ciBlYXJsaWVyIGBkZXRlY3Rpb25fbWF0YCB0byBhZGQgdXAgaG93IG1hbnkgY2VsbHMgZXhwcmVzcyBlYWNoIGdlbmUsIGJ1dCB3ZSB3aWxsIHNraXAgc3RyYWlnaHQgdG8gdGhlIGBzY2F0ZXJgIGZ1bmN0aW9uIHRoaXMgdGltZSwgd2hpY2ggaXMgY2FsbGVkIGBhZGRQZXJGZWF0dXJlUUMoKWAuClRoaXMgd2lsbCBhZGQgUUMgc3RhdGlzdGljcyB0byB0aGUgYHJvd0RhdGFgIGZvciBlYWNoIGdlbmUgKGFsb25nc2lkZSB0aGUgYW5ub3RhdGlvbiBkYXRhIHdlIGFscmVhZHkgaGFkIHRoZXJlKQpUaGUgY29sdW1ucyBpdCBhZGRzIGFyZSB0aGUgYXZlcmFnZSBleHByZXNzaW9uIGxldmVsIG9mIGVhY2ggZ2VuZSAoYG1lYW5gKSBhbmQgdGhlIHBlcmNlbnRhZ2Ugb2YgY2VsbHMgaW4gd2hpY2ggaXQgd2FzIGRldGVjdGVkIChgZGV0ZWN0ZWRgKS4KCmBgYHtyIHNhbXBsZV9leHAsIGxpdmUgPSBUUlVFfQpibGFkZGVyX3NjZV9maWx0ZXJlZCA8LSBzY2F0ZXI6OmFkZFBlckZlYXR1cmVRQyhibGFkZGVyX3NjZV9maWx0ZXJlZCkKYGBgCgpMZXQncyBtYWtlIGFub3RoZXIgZGVuc2l0eSBwbG90IHdpdGggdGhlIHBlcmNlbnRhZ2Ugb2Ygc2FtcGxlcyB0aGF0IGV4cHJlc3MgZWFjaCBnZW5lOgoKYGBge3Igc2FtcGxlX2V4cF9wbG90fQojIGV4dHJhY3QgdGhlIGdlbmUgaW5mb3JtYXRpb24gd2l0aApnZW5lX2luZm8gPC0gZGF0YS5mcmFtZShyb3dEYXRhKGJsYWRkZXJfc2NlX2ZpbHRlcmVkKSkKCiMgUGxvdCB0aGUgZGV0ZWN0ZWQgcGVyY2VudGFnZQpnZ3Bsb3QoZ2VuZV9pbmZvLCBhZXMoeCA9IGRldGVjdGVkKSApKwogIGdlb21fZGVuc2l0eShmaWxsID0gImxpZ2h0Ymx1ZSIpICsKICBsYWJzKHggPSAiUGVyY2VudCBvZiBDZWxscyBFeHByZXNzaW5nIEVhY2ggR2VuZSIpICsKICB0aGVtZV9jbGFzc2ljKCkKYGBgCgpIb3cgbWFueSBnZW5lcyB3aWxsIGJlIGV4Y2x1ZGVkIGlmIHdlIGRyYXcgb3VyIGN1dG9mZiBhdCA1JSBvZiBjZWxscz8KCmBgYHtyIGZpbHRlcl9lZmZlY3QsIGxpdmUgPSBUUlVFfQpzdW0oZ2VuZV9pbmZvJGRldGVjdGVkIDwgNSkKYGBgCgpUaGF0J3MgYSBsb3QhIEhvdyBkbyB3ZSBmZWVsIGFib3V0IHRoYXQ/CgpgYGB7ciBmaWx0ZXJfZ2VuZXMsIGxpdmUgPSBUUlVFfQpjdXRvZmYgPC0gMgojIGZpbHRlciBibGFkZGVyX3NjZV9maWx0ZXJlZCB0byBvbmx5IGdlbmVzIGFib3ZlIGEgY3V0b2ZmIHZhbHVlCmJsYWRkZXJfc2NlX2ZpbHRlcmVkIDwtIGJsYWRkZXJfc2NlX2ZpbHRlcmVkW2dlbmVfaW5mbyRkZXRlY3RlZCA+PSBjdXRvZmYsIF0KYGBgCgpIb3cgYmlnIGlzIHRoZSBgU2luZ2xlQ2VsbEV4cGVyaW1lbnRgIG9iamVjdCBub3c/CgpgYGB7ciBmaWx0ZXJlZF9zaXplLCBsaXZlID0gVFJVRX0KZGltKGJsYWRkZXJfc2NlX2ZpbHRlcmVkKQpgYGAKCiMjIFNhdmUgdGhlIGZpbHRlcmVkIGRhdGEKCldlIHdpbGwgc2F2ZSB0aGUgZmlsdGVyZWQgYFNpbmdsZUNlbGxFeHBlcmltZW50YCBvYmplY3QgYXMgYSBgLnJkc2AgZmlsZSBmb3IgbGF0ZXIgdXNlLgoKYGBge3Igc2F2ZV9yZHN9CiMgU2F2ZSBvYmplY3QgdG8gdGhlIGZpbGUgZmlsdGVyZWRfc2NlX2ZpbGUsIHdoaWNoCiMgd2UgZGVmaW5lZCBhdCB0aGUgdG9wIG9mIHRoaXMgbm90ZWJvb2sKcmVhZHI6OndyaXRlX3JkcyhibGFkZGVyX3NjZV9maWx0ZXJlZCwgZmlsZSA9IGZpbHRlcmVkX3NjZV9maWxlKQpgYGAKCgojIyMgUHJpbnQgc2Vzc2lvbiBpbmZvCgpgYGB7ciBzZXNzaW9uaW5mb30Kc2Vzc2lvbkluZm8oKQpgYGAK

Single cell RNA-seq quality control and filtering

CCDL for ALSF

2021

Objectives

Set Up

Import single-cell RNA-seq quantification

Directories and files

Importing alevin results with tximeta

Summarizing expression

Quality control measures for the counts matrix

Total counts as a quality measure

Number of genes a cell expressed as a quality measure

Mitochondrial gene expression

Combining sample QC measures

Filtering the `SingleCellExperiment` directly

Calculating cell QC stats with `scater`

Applying a filter to a `SingleCellExperiment`

Number of cells that express a gene as a quality measure

Save the filtered data

Print session info

Single cell RNA-seq quality control and filtering

CCDL for ALSF

2021

Objectives

Set Up

Import single-cell RNA-seq quantification

Directories and files

Importing alevin results with tximeta

Summarizing expression

Quality control measures for the counts matrix

Total counts as a quality measure

Number of genes a cell expressed as a quality measure

Mitochondrial gene expression

Combining sample QC measures

Filtering the SingleCellExperiment directly

Calculating cell QC stats with scater

Applying a filter to a SingleCellExperiment

Number of cells that express a gene as a quality measure

Save the filtered data

Print session info

Filtering the `SingleCellExperiment` directly

Calculating cell QC stats with `scater`

Applying a filter to a `SingleCellExperiment`