Changeset 31352 for other-projects


Ignore:
Timestamp:
2017-01-24T21:54:12+13:00 (7 years ago)
Author:
davidb
Message:

collection-to-workset now with id-check added to filter

File:
1 edited

Legend:

Unmodified
Added
Removed
  • other-projects/hathitrust/wcsa/vol-checker/src/org/hathitrust/extractedfeatures/VolumeCheck.java

    r31348 r31352  
    213213            BufferedReader reader = new BufferedReader(isr);
    214214           
    215             StringBuilder sb = new StringBuilder();
     215            StringBuilder workset_friendly_sb = new StringBuilder();
     216            StringBuilder workset_unfriendly_sb = new StringBuilder();
     217           
    216218            String line = null;
     219            int ci = 0;
    217220            while ((line = reader.readLine()) != null)
    218221            {
    219                 sb.append(line + "\n");
     222                if (ci==0) {
     223                    workset_friendly_sb.append("#" + line + "\n");
     224                }
     225                else {
     226                    int first_tab_pos=line.indexOf("\t");
     227                    String id = (first_tab_pos>0) ? line.substring(0, first_tab_pos) : line;
     228                   
     229                    if (id_check_.containsKey(id)) {
     230                        workset_friendly_sb.append(line + "\n");       
     231                    }
     232                    else {
     233                        workset_unfriendly_sb.append("#" + line + "\n");
     234                    }
     235                }
     236               
     237                ci++;
    220238            }
    221239             
    222240            response.setContentType("text/plain");
    223241            PrintWriter pw = response.getWriter();
    224             pw.append(sb.toString());
     242            pw.append(workset_friendly_sb.toString());
     243            pw.append("## The following volumes are not in the HTRC Extracted Feature dataset\n");
     244            pw.append(workset_unfriendly_sb.toString());
    225245        }
    226246        catch (Exception e) {
     
    242262        String cgi_convert_col = request.getParameter("convert-col");
    243263       
    244         System.err.println("**** cgi_convert_col = '" + cgi_convert_col + "'");
     264        //System.err.println("**** cgi_convert_col = '" + cgi_convert_col + "'");
    245265       
    246266        if (cgi_ids != null) {
Note: See TracChangeset for help on using the changeset viewer.