<html>
<body>
Hi,<br><br>
<blockquote type=cite class=cite cite>I am new to OAI. I am a student. I
came across OAI when i was working for my class project.
</blockquote><br>
I'm not sure if you have just study the OAI-PMH protocol, but I stress an
important thing about it:<br>
It is a protocolor to HARVEST, COLLECT data. You CAN'T SEACH with
OAI-PMH<br><br>
The only search you can do, it is possibile with oai-identifiers.<br>
So first you need to find the oai-identifiers, after you can download the
records in format XML writting the query with OAI-PMH.<br><br>
<blockquote type=cite class=cite cite>I dont know how to get the records,
from the harvest url. I dont want to use database because the extension
should be cross platform and if i use some databse application then the
user should install that software on his local machine. <br>
&nbsp;<br>
how can i get the records in xml format? </blockquote><br><br>
To operate with
<a href="http://www.citeseer.com">www</a>.citeseer.<a href="http://www.citeseer.com">com</a>:<br><br>
<br>
1) lanch a query on
<a href="http://cs1.ist.psu.edu/cis" eudora="autourl">http://cs1.ist.psu.edu/cis</a>,
read the HML of
<a href="http://cs1.ist.psu.edu/" eudora="autourl">http://cs1.ist.psu.edu/</a>
to see the parametres.<br>
2)Parse the result (an HTML page)<br>
2.1) the link in the results have the structure: <a href="http://cs1.ist.psu.edu/" eudora="autourl">http://cs1.ist.psu.edu/</a>&lt;id&gt;.html<br>
2.2)Downlond the xml with the query <a href="http://cs1.ist.psu.edu/cgi-bin/oai.cgi?verb=GetRecord&amp;metadataPrefix=oai_dc&amp;identifier=oai:CiteSeerPSU" eudora="autourl">http://cs1.ist.psu.edu/cgi-bin/oai.cgi?verb=GetRecord&amp;metadataPrefix=oai_dc&amp;identifier=oai:CiteSeerPSU</a>:&lt;id&gt;<br><br>
But keep attention, not always &lt;id&gt; avaibles in the results pages are correct for OAI interface.<br>
Ids like 55167, 432119, the numeric ids, are correct.<br>
Ids like morris99analysing, costa93maximumlikelihood, the alphanumeric ids, are not correct.<br>
You can find the correct id opening the linked page with full dispaly and parsing it.<br>
Probably the link labeled 'Make Corrections' is a good place to find the correct numeric id<br><br>
So, as you see, you need many parsing operation.<br>
If CiteSeer.CS1 mantainer reeds us, he probaly know a better way.<br><br>
When you have finish the plugin, inform us where we can download it.<br><br>
Bye<br><br>
<br>
</body>
<br>
<br>
<br>
<div>Zeno Tajoli</div>
<div>CILEA - Segrate (MI)</div>
<div>tajoliAT_SPAM_no_prendiATcilea.it</div>
<div>(Indirizzo mascherato anti-spam; sostituisci quanto tra AT con @)</div>
</html>