doc/course/src/exercise/proteiosSE.html

Code
Comments
Other
Rev Date Author Line
4093 12 Jan 11 gregory 1 <?xml version="1.0"?>
4093 12 Jan 11 gregory 2 <html xmlns="http://www.w3.org/1999/xhtml"
4093 12 Jan 11 gregory 3 xmlns:v="http://localhost" xml:lang="en" lang="en">
4093 12 Jan 11 gregory 4   <head>
4093 12 Jan 11 gregory 5     <link rel="stylesheet" type="text/css" href="../css/exercise.css" />
4093 12 Jan 11 gregory 6     <link rel="stylesheet" type="text/css"
4093 12 Jan 11 gregory 7     href="../css/default.css" />
4093 12 Jan 11 gregory 8     <title>Proteios Software Environment Exercise</title>
4093 12 Jan 11 gregory 9   </head>
4093 12 Jan 11 gregory 10   <body>
4093 12 Jan 11 gregory 11     <h1>Generating a quantitative report from LC-MS runs with
4093 12 Jan 11 gregory 12     isobaric labels</h1>
4093 12 Jan 11 gregory 13     <h3>Background</h3>
4093 12 Jan 11 gregory 14     <p>The protein levels of yeast (Saccharomyces cerevisiae) grown
4093 12 Jan 11 gregory 15     under two different conditions will be compared. For this analysis the
4093 12 Jan 11 gregory 16     samples were reduced and alkylated using iodoacetamide,
4093 12 Jan 11 gregory 17     digested with trypsin and labelled using the isobaric label
4093 12 Jan 11 gregory 18     TMT. Labels 126,128 and 130 were used for one cell state, and
4093 12 Jan 11 gregory 19     127,129 and 131 for the other. The labelled peptides were
4093 12 Jan 11 gregory 20     loaded onto a nano LC system and analysed on-line using an
4093 12 Jan 11 gregory 21     LTQ-Orbitrap. To get many peptide identifications, CID
4093 12 Jan 11 gregory 22     fragmentation and analysis in the linear trap was used.
4093 12 Jan 11 gregory 23     However, the reporter ions are not visible in most of the
4093 12 Jan 11 gregory 24     spectra, since they are found at lower masses than what can be
4093 12 Jan 11 gregory 25     analysed in the ion trap using CID fragmentation. To overcome
4093 12 Jan 11 gregory 26     this, each MS/MS scan in the linear trap was followed by an
4093 12 Jan 11 gregory 27     MS/MS scan in the Orbitrap of the same precursor ion using
4093 12 Jan 11 gregory 28     high-energy collision- induced dissociation (HCD) fragmentation
4093 12 Jan 11 gregory 29     .</p>
4093 12 Jan 11 gregory 30     <h3>Proteios Software Environment (ProSE)</h3>
4093 12 Jan 11 gregory 31     <p>The major reason for using ProSE in this project was to get
4093 12 Jan 11 gregory 32     a large number of confident peptide identifications at a
4093 12 Jan 11 gregory 33     controlled error rate and to automatically get the reporter
4093 12 Jan 11 gregory 34     ion ratios included in the report. The reporter ion quantities
4093 12 Jan 11 gregory 35     need to be retained from adjacent scans for CID-based
4093 12 Jan 11 gregory 36     identifications. Here we have chosen not to enter sample
4093 12 Jan 11 gregory 37     tracking information into ProSE, but rather to generate a
4093 12 Jan 11 gregory 38     report as quickly as possible. The following steps are then
4093 12 Jan 11 gregory 39     used:</p>
4093 12 Jan 11 gregory 40     <ol>
4093 12 Jan 11 gregory 41       <li>Login to the ProSE server at 
4093 12 Jan 11 gregory 42       <a target="proteios"
4093 12 Jan 11 gregory 43       href="http://proteios.immunoprot.lth.se:8080/proteios/app">
4093 12 Jan 11 gregory 44       http://proteios.immunoprot.lth.se:8080/proteios/app</a>
4093 12 Jan 11 gregory 45       <br />
4093 12 Jan 11 gregory 46       <b>Accounts:</b>user1,user2,user3 (passwords are
4093 12 Jan 11 gregory 47       user1,user2,user3)</li>
4093 12 Jan 11 gregory 48       <li>Create a new project 
4093 12 Jan 11 gregory 49       <ul>
4093 12 Jan 11 gregory 50         <li>
4093 12 Jan 11 gregory 51           <ul class="clickstream">
4093 12 Jan 11 gregory 52             <li>File</li>
4093 12 Jan 11 gregory 53             <li>New</li>
4093 12 Jan 11 gregory 54             <li>Project</li>
4093 12 Jan 11 gregory 55           </ul>
4093 12 Jan 11 gregory 56         </li>
4093 12 Jan 11 gregory 57         <li>Select non-gel project as type</li>
4093 12 Jan 11 gregory 58         <li class="click">Save</li>
4093 12 Jan 11 gregory 59       </ul></li>
4093 12 Jan 11 gregory 60       <li>The sample data, consisting of raw data from LC-MS/MS
4093 12 Jan 11 gregory 61       runs have been converted to mzData and has to be uploaded to
4093 12 Jan 11 gregory 62       ProSE. We've used Proteome Discoverer (Thermo Scientific) for
4093 12 Jan 11 gregory 63       the conversion, and the two centroid mzData peak lists files
4093 12 Jan 11 gregory 64       should be uploaded. Files can be uploaded one by one using
4093 12 Jan 11 gregory 65       the web browser, but for batch upload the normal way would be
4093 12 Jan 11 gregory 66       to use ftp. To upload through the browser 
4093 12 Jan 11 gregory 67       <ul>
4093 12 Jan 11 gregory 68         <li>
4093 12 Jan 11 gregory 69           <ul class="clickstream">
4093 12 Jan 11 gregory 70             <li>project_name</li>
4093 12 Jan 11 gregory 71             <li>files</li>
4093 12 Jan 11 gregory 72           </ul>
4093 12 Jan 11 gregory 73         </li>
4093 12 Jan 11 gregory 74         <li class="click">Upload file</li>
4093 12 Jan 11 gregory 75       </ul>
4093 12 Jan 11 gregory 76       <b>The files are located:</b>X:\ProSE_TMT_exercise
4093 12 Jan 11 gregory 77       <br />For future ftp usage, the fireFTP plugin for Mozilla
4093 12 Jan 11 gregory 78       Firefox can be used, or the standalone ftp-client Filezilla.
4093 12 Jan 11 gregory 79       Other ftp-clients may work aswell. The ftp server address is 
4093 12 Jan 11 gregory 80       <b>proteios.immunoprot.lth.se:8021</b></li>
4093 12 Jan 11 gregory 81       <li>Typically the MS/MS peptide identification searches are
4093 12 Jan 11 gregory 82       performed directly from ProSE. 
4093 12 Jan 11 gregory 83       <ul>
4093 12 Jan 11 gregory 84         <li>Configure search parameters 
4093 12 Jan 11 gregory 85         <ul>
4093 12 Jan 11 gregory 86           <li>
4093 12 Jan 11 gregory 87             <ul class="clickstream">
4093 12 Jan 11 gregory 88               <li>View</li>
4093 12 Jan 11 gregory 89               <li>Search Setup</li>
4093 12 Jan 11 gregory 90               <li>Mascot</li>
4093 12 Jan 11 gregory 91             </ul>
4093 12 Jan 11 gregory 92           </li>
4093 12 Jan 11 gregory 93           <li class="click">New Mascot Parameter Set</li>
4093 12 Jan 11 gregory 94           <li>Fill out form</li>
4093 12 Jan 11 gregory 95           <li class="click">Save</li>
4093 12 Jan 11 gregory 96           <li class="click">Your saved parameter set in the
4093 12 Jan 11 gregory 97           list</li>
4093 12 Jan 11 gregory 98           <li>Fill out form</li>
4093 12 Jan 11 gregory 99           <li class="click">Save</li>
4093 12 Jan 11 gregory 100         </ul></li>
4093 12 Jan 11 gregory 101         <li>Start search 
4093 12 Jan 11 gregory 102         <ul>
4093 12 Jan 11 gregory 103           <li>
4093 12 Jan 11 gregory 104             <ul class="clickstream">
4093 12 Jan 11 gregory 105               <li>Your Project</li>
4093 12 Jan 11 gregory 106               <li>Spectrum Search</li>
4093 12 Jan 11 gregory 107               <li>Mascot</li>
4093 12 Jan 11 gregory 108             </ul>
4093 12 Jan 11 gregory 109           </li>
4093 12 Jan 11 gregory 110           <li class="click">Select spectrum files</li>
4093 12 Jan 11 gregory 111           <li class="click">Next - Select Mascot Search User
4093 12 Jan 11 gregory 112           Data</li>
4093 12 Jan 11 gregory 113           <li>Fill out form</li>
4093 12 Jan 11 gregory 114           <li class="click">Next - Select Mascot parameter set</li>
4093 12 Jan 11 gregory 115           <li>Select the previously created parameter set</li>
4093 12 Jan 11 gregory 116           <li class="click">Next - Create search job[s]</li>
4093 12 Jan 11 gregory 117         </ul></li>
4093 12 Jan 11 gregory 118       </ul>Depending number of files and configuration the jobs may
4093 12 Jan 11 gregory 119       take a while to execute.
4093 12 Jan 11 gregory 120       <br />However, in this example, the searches are already
4093 12 Jan 11 gregory 121       done, so you may upload the 6 files with search results.</li>
4093 12 Jan 11 gregory 122       <li>Now the report generation can begin. First the peak list
4093 12 Jan 11 gregory 123       files need to be registered. To do this 
4093 12 Jan 11 gregory 124       <ul>
4093 12 Jan 11 gregory 125         <li>
4093 12 Jan 11 gregory 126           <ul class="clickstream">
4093 12 Jan 11 gregory 127             <li>project_name</li>
4093 12 Jan 11 gregory 128             <li>Hits Import</li>
4093 12 Jan 11 gregory 129             <li>Non gel based</li>
4093 12 Jan 11 gregory 130           </ul>
4093 12 Jan 11 gregory 131         </li>
4093 12 Jan 11 gregory 132         <li>Enter a local sample id for step 1, for example
4093 12 Jan 11 gregory 133         'pool'</li>
4093 12 Jan 11 gregory 134         <li>
4093 12 Jan 11 gregory 135           <ul class="clickstream">
4093 12 Jan 11 gregory 136             <li>Next</li>
4093 12 Jan 11 gregory 137             <li>Select peak list files</li>
4093 12 Jan 11 gregory 138           </ul>
4093 12 Jan 11 gregory 139         </li>
4093 12 Jan 11 gregory 140         <li>Check the check boxes in front of the peak list files
4093 12 Jan 11 gregory 141         in the next step 
4093 12 Jan 11 gregory 142         <div class="note">Do not select the search result files
4093 12 Jan 11 gregory 143         here.</div></li>
4093 12 Jan 11 gregory 144         <li class="click">import</li>
4093 12 Jan 11 gregory 145       </ul></li>
4093 12 Jan 11 gregory 146       <li>When the jobs have finished you can check the results by
4093 12 Jan 11 gregory 147       looking in 
4093 12 Jan 11 gregory 148       <ul class="clickstream in">
4093 12 Jan 11 gregory 149         <li>project_name</li>
4093 12 Jan 11 gregory 150         <li>Reports</li>
4093 12 Jan 11 gregory 151         <li>Hits</li>
4093 12 Jan 11 gregory 152       </ul>. It should now just contain the peak list files, but no
4093 12 Jan 11 gregory 153       identifications.</li>
4093 12 Jan 11 gregory 154       <li>The next step is to import the search results. This is
4093 12 Jan 11 gregory 155       done in the second step in the Non Gel Based hits import. 
4093 12 Jan 11 gregory 156       <ul>
4093 12 Jan 11 gregory 157         <li>
4093 12 Jan 11 gregory 158           <ul class="clickstream">
4093 12 Jan 11 gregory 159             <li>project_name</li>
4093 12 Jan 11 gregory 160             <li>Hits Import</li>
4093 12 Jan 11 gregory 161             <li>Non gel based</li>
4093 12 Jan 11 gregory 162           </ul>
4093 12 Jan 11 gregory 163         </li>
4093 12 Jan 11 gregory 164         <li class="click">Next - Select Search Result File[s]</li>
4093 12 Jan 11 gregory 165         <li>Check the check boxes in front of the search results
4093 12 Jan 11 gregory 166         files</li>
4093 12 Jan 11 gregory 167         <li class="click">Import</li>
4093 12 Jan 11 gregory 168       </ul>Note that the search results files were uploaded in step
4093 12 Jan 11 gregory 169       4. The import step serves to get the results into the
4093 12 Jan 11 gregory 170       database tables.</li>
4093 12 Jan 11 gregory 171       <li>When the jobs have finished, 
4093 12 Jan 11 gregory 172       <ul class="clickstream in">
4093 12 Jan 11 gregory 173         <li>Reports</li>
4093 12 Jan 11 gregory 174         <li>Hits</li>
4093 12 Jan 11 gregory 175       </ul>will contain a lot of results, which can be navigated
4093 12 Jan 11 gregory 176       and filtered. However, there is still no validation and
4093 12 Jan 11 gregory 177       consensus usage of the search results from different search
4093 12 Jan 11 gregory 178       engines. Select columns and filter the report to show only
4093 12 Jan 11 gregory 179       enolase 2. 
4093 12 Jan 11 gregory 180       <div class="question">How many entries are there?</div>Filter
4093 12 Jan 11 gregory 181       the report to show all peptides from enolase 2 (P00925). 
4093 12 Jan 11 gregory 182       <div class="question">How many Mascot results are there for
4093 12 Jan 11 gregory 183       peptides that are unique to P00925 and which exist in P00925
4093 12 Jan 11 gregory 184       and other proteins too respectively?</div></li>
4093 12 Jan 11 gregory 185       <li>Combination of the search results from different search
4093 12 Jan 11 gregory 186       engines is performed by selecting 
4093 12 Jan 11 gregory 187       <ul>
4093 12 Jan 11 gregory 188         <li>
4093 12 Jan 11 gregory 189           <ul class="clickstream in">
4093 12 Jan 11 gregory 190             <li>Reports</li>
4093 12 Jan 11 gregory 191             <li>Combined Hits</li>
4093 12 Jan 11 gregory 192           </ul>
4093 12 Jan 11 gregory 193         </li>
4093 12 Jan 11 gregory 194         <li>Select the local sample Id that you used in step 5</li>
4093 12 Jan 11 gregory 195       </ul>and make sure that combination is performed on the
4093 12 Jan 11 gregory 196       peptide level. If combination is performed on the Protein
4093 12 Jan 11 gregory 197       level, no peptide score cut off will be used, which is
4093 12 Jan 11 gregory 198       dangerous in experiments with complex peptide mixtures. Decoy
4093 12 Jan 11 gregory 199       (random) identifications have the prefix 'r' and not the
4093 12 Jan 11 gregory 200       default 'IPR'. Set the parameters and start the job. A
4093 12 Jan 11 gregory 201       peptide report will now be built up, where the false
4093 12 Jan 11 gregory 202       discovery rate for peptides will be calculated. The report
4093 12 Jan 11 gregory 203       will be written to file, and in addition, the Hits report is
4093 12 Jan 11 gregory 204       updated with Combined FDR values that can be used for
4093 12 Jan 11 gregory 205       filtering. Open up the generated tab-separated file. 
4093 12 Jan 11 gregory 206       <div class="question">How many peptide identifications were
4093 12 Jan 11 gregory 207       retained?</div></li>
4093 12 Jan 11 gregory 208       <li>Generation of the protein report, including reporter
4093 12 Jan 11 gregory 209       ratios. This is done by selecting 
4093 12 Jan 11 gregory 210       <ul class="clickstream in">
4093 12 Jan 11 gregory 211         <li>Reports</li>
4093 12 Jan 11 gregory 212         <li>Protein Assembly</li>
4093 12 Jan 11 gregory 213       </ul>. Select the local sample ID and select TMT label. The
4093 12 Jan 11 gregory 214       generated report will contain a list of protein groups that
4093 12 Jan 11 gregory 215       include the identified peptides that pass the FDR cut-off.
4093 12 Jan 11 gregory 216       The ratios of the reporter ions will be displayed for all
4093 12 Jan 11 gregory 217       peptides, and an average will be calculated for the protein
4093 12 Jan 11 gregory 218       group. 
4093 12 Jan 11 gregory 219       <div class="question">How many protein groups were
4093 12 Jan 11 gregory 220       there?</div>
4093 12 Jan 11 gregory 221       <div class="question">What is a protein group?</div></li>
4093 12 Jan 11 gregory 222     </ol>
4093 12 Jan 11 gregory 223   </body>
4093 12 Jan 11 gregory 224 </html>