00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015 #ifndef CGATOOLS_VARIANTS_CALIB_CALIBRATEDSCORER_HPP_
00016 #define CGATOOLS_VARIANTS_CALIB_CALIBRATEDSCORER_HPP_ 1
00017
00019
00020 #include "cgatools/core.hpp"
00021 #include "cgatools/util/Exception.hpp"
00022
00023 #include <vector>
00024 #include <boost/shared_ptr.hpp>
00025
00026 namespace cgatools { namespace variants { namespace calib {
00027
00028 class CoverageBinner
00029 {
00030 public:
00031 CoverageBinner()
00032 : cvgLevels_(1, 0)
00033 {
00034 }
00035
00036 CoverageBinner(const std::vector<int32_t>& cvgLevels);
00037
00038 size_t getBin(int32_t cvg) const
00039 {
00040 size_t result = 0;
00041 for(size_t ii=0; ii<cvgLevels_.size(); ii++)
00042 {
00043 if (cvgLevels_[ii] <= cvg)
00044 result = ii;
00045 }
00046 return result;
00047 }
00048
00049 size_t getBinCount() const
00050 {
00051 return cvgLevels_.size();
00052 }
00053
00054 int32_t getMinCvg(size_t bin) const
00055 {
00056 return cvgLevels_[bin];
00057 }
00058
00059 private:
00060 std::vector< int32_t > cvgLevels_;
00061 };
00062
00063 class CalibratedScorer
00064 {
00065 public:
00066
00067
00068
00069
00070
00071
00072
00073
00074
00075
00076
00077
00078
00079
00080
00081
00082
00083
00084
00085
00086
00087
00088
00089
00090
00091
00092
00093
00094
00095
00096
00097
00098
00099
00100
00101 CalibratedScorer(
00102 const std::string& varType,
00103 const std::string& scoreType,
00104 bool eaf,
00105 const std::string& dataPath,
00106 const std::string& softwareVersion,
00107 double a20Mixture = 0.0,
00108 double refBasesPerHetVariant = 0.0);
00109
00110 double getCalibratedScore(int32_t cvg, int32_t score) const
00111 {
00112 return S_[binner_.getBin(cvg)][scoreToOffset(score)];
00113 }
00114
00115 double getCalibratedLikelihoodRatio(int32_t cvg, int32_t score) const
00116 {
00117 return L_[binner_.getBin(cvg)][scoreToOffset(score)];
00118 }
00119
00120 double getPTrue(int32_t cvg, int32_t score) const
00121 {
00122 return PTrue_[binner_.getBin(cvg)][scoreToOffset(score)];
00123 }
00124
00125 const CoverageBinner& getBinner() const
00126 {
00127 return binner_;
00128 }
00129
00130 int32_t getMinScore() const
00131 {
00132 return minScore_;
00133 }
00134
00135 int32_t getMaxScore() const
00136 {
00137 return minScore_ + S_[0].size()-1;
00138 }
00139
00140 private:
00141 void getScoreStreams(
00142 const std::string& calibId,
00143 const std::string& dataPath,
00144 const std::string& softwareVersion,
00145 boost::shared_ptr<std::istream>& inMetrics,
00146 boost::shared_ptr<std::istream>& inData,
00147 std::string& fnMetrics,
00148 std::string& fnData,
00149 std::string& fnDataA20) const;
00150
00151 void readData(
00152 std::istream& inData,
00153 const std::string& fnData,
00154 CoverageBinner& binner,
00155 std::vector< std::vector<double> >& SS,
00156 int32_t& minScore);
00157
00158 size_t scoreToOffset(int32_t score) const
00159 {
00160 score = std::max(score, minScore_);
00161 size_t offset = score-minScore_;
00162 offset = std::min(offset, S_[0].size()-1);
00163 return offset;
00164 }
00165
00166 int swVersionToInt(const std::string& versionStr) const;
00167
00168 CoverageBinner binner_;
00169 std::vector< std::vector<double> > S_, L_, PTrue_;
00170 int32_t minScore_;
00171 };
00172
00173 } } }
00174
00175 #endif // CGATOOLS_VARIANTS_CALIB_CALIBRATEDSCORER_HPP_