ChinaUnixÊ×Ò³ > ¾«»ªÎÄÕ > C/C++ > ÕýÎÄ

[Ô­´´] ·¢²¼Îҵĵ¹ÅÅË÷Òý


http://www.chinaunix.net ×÷Õß:redor  ·¢±íÓÚ£º2008-07-04 08:28:16
¡¾·¢±íÆÀÂÛ¡¿ ¡¾²é¿´Ô­ÎÄ¡¿ ¡¾C/C++ÌÖÂÛÇø¡¿¡¾¹Ø±Õ¡¿

ÏÂÔØµØÖ· http://libibase.googlecode.com/

Ö÷Òª¹¦ÄÜ:
  ½âÎöHTML
  ÖÐÎÄ·Ö´Ê(·´Ïò×î´óÆ¥Åä,ÓÃtrieʵÏÖ)
  Éú³ÉÕýÏòÎĵµ(ÎÒ×Ô¼º¶¨ÒåµÄ¸ñʽ,ÔÝʱÊÇÕâÑù)
  Éú³Éµ¹ÅÅË÷Òý(·Ö¿é´æ´¢,bytecodeѹËõËã·¨, ÕýÎĺͿìÕÕ²ÉÓÃzlibѹËõ)
  Ìá½»²éѯ´®¼ìË÷(ֻʵÏÖÁËÏòÁ¿¿Õ¼äÄ£ÐÍ, ¶¯Ì¬ÕªÒª»¹Ã»Íê³É)
  Ä¿Ç°Ö»ÓÐÒ»¸öÃüÁîÐвâÊÔ¹¤¾ßhibase 
  °üÄÚ×Ô´ø10wÖÐÎÄ´Ê¿â(docĿ¼ÏÂ,gzip¸ñʽ, Ê¹ÓõÄʱºòÐèÒª½â¿ª)
  Ê¹Ó÷½·¨¿ÉÒÔ¿´README

½ÓÏÂÀ´¾ÍÊDzâÊÔºÍÓÅ»¯,ÒòΪдµÄʱºòºê±È½Ï¶à,ËùÒÔ±àÒ뻹ÊÇÓеãÂý....ºÇºÇ

ÒªÒ»¿éѧϰµÄ¿ÉÒÔ¼ÓÎÒµÄMSN/GTAIL : [email]sounos@gmail.com[/email]

˳±ãÌùÒ»¸öʹÓÃʵÀý:
ÎÒÓÃwgetÏÂÁËchinaunixµÄÊ×Ò³µ½/data/htmlĿ¼Ï /data/dictÏÂÊÇÎҵĴʵä

./hibase --basedir=/tmp --dict=/data/dict/dict.txt --add --doc=/data/html/index.html --url=http://www.chinaunix.net/ --date="Thu, 03 Jul 2008 10:12:18 GMT" --charset="gbk" --query --request="chinaunix" --topN=1000
parsing document[http://www.chinaunix.net/] time used:16825 microseconds
adding document[http://www.chinaunix.net/] time used:47955 microseconds
parse query time used:36
read hits[1] posting time used:1897
Caculated 1 documents time used:22
read 1 documents content time used:1404
(0) title[ChinaUnix.net = È«Çò×î´óµÄLinux/UnixÓ¦ÓÃÓ뿪·¢ÕßÉçÇø = ITÈ˵ÄÍøÉϼÒÔ°]
summary[(null)]
url[http://www.chinaunix.net/]
size[84892]date[Thu, 03 Jul 2008 10:12:18 GMT]

search [chinaunix] time used:3502


[ ±¾Ìû×îºóÓÉ redor ÓÚ 2008-7-4 21:08 ±à¼­ ]



 cugb_cat »Ø¸´ÓÚ£º2008-07-03 16:02:36

²»´í~


 pengjay »Ø¸´ÓÚ£º2008-07-03 17:06:35

Å£x


 benjiam »Ø¸´ÓÚ£º2008-07-03 17:16:54

ÎÞ·¨±àÒëͨ¹ý£¬
charcode.h ²ÉÓÃʲô±àÂë¸ñʽ±àдµÄ£¿

vc ÏÂÃæ ³öÏÖ ×Ö·û´®ÎÞ·¨Ê¶±ð¡£Ó¦¸ÃÊÇÄÚÂëgb2312 utf-8 unicode ¶¼²»ÐÐ


 redor »Ø¸´ÓÚ£º2008-07-03 17:57:18

ÒýÓãºÔ­ÌûÓÉ benjiam ÓÚ 2008-7-3 17:16 ·¢±í [url=http://bbs.chinaunix.net/redirect.php?goto=findpost&pid=8730113&ptid=1187515]
ÎÞ·¨±àÒëͨ¹ý£¬
charcode.h ²ÉÓÃʲô±àÂë¸ñʽ±àдµÄ£¿

vc ÏÂÃæ ³öÏÖ ×Ö·û´®ÎÞ·¨Ê¶±ð¡£Ó¦¸ÃÊÇÄÚÂëgb2312 utf-8 unicode ¶¼²»ÐР



ÎÒÏÖÔÚÊÇUTF-8µÄ,VCÏÂÎÒû±à¹ý,¹À¼Æ¹»Çº....
ÎÒ¸øÌùÒ»¸öÉÏÀ´°É


#include <stdio.h>
#include <string.h>
#ifndef _CHARCODE_H
#define _CHARCODE_H
#define CHARCODE_NUM 252
typedef struct _CHARCODE
{
        char *dec;
        char *code;
        char *chr;
        char *desc;
}CHARCODE;
static CHARCODE charcodelist[] =
{
{"&#160;", "&nbsp;", " ", "no-break space"},
{"&#161;", "&iexcl;", "&#161;", "inverted exclamation mark"},
{"&#162;", "&cent;", "¡é", "cent sign"},
{"&#163;", "&pound;", "¡ê", "pound sign"},
{"&#164;", "&curren;", "¡è", "currency sign"},
{"&#165;", "&yen;", "£¤", "yen sign = yuan sign"},
{"&#166;", "&brvbar;", "|", "broken bar = brolen vertical bar"},
{"&#167;", "&sect;", "¡ì", "section sign"},
{"&#168;", "&uml;", "¡§", "diaeresis = spacing diaeresis"},
{"&#169;", "&copy;", "&#169;", "copyright sign"},
{"&#170;", "&ordf;", "a", "feminine ordinal indicator"},
{"&#171;", "&laquo;", "&#171;", "left-pointing double angle quotation mark = left pointing guillemet"},
{"&#172;", "&not;", "&#172;", "not sign = discretionary hyphen"},
{"&#173;", "&shy;", "-", "soft hyphen = discretionary hyphen"},
{"&#174;", "&reg;", "&#174;", "registered sign = registered trade mark sign"},
{"&#175;", "&macr;", "¡¥", "macron = spacing macron = overline = APL overbar"},
{"&#176;", "&deg;", "¡ã", "degree sign"},
{"&#177;", "&plusmn;", "¡À", "plus-minus sign = plus-or-minus sign"},
{"&#178;", "&sup2;", "2", "superscript two = superscript digit two = squared"},
{"&#179;", "&sup3;", "3", "superscript three = superscript digit three = cubed"},
{"&#180;", "&acute;", "¡ä", "acute accent = spacing acute"},
{"&#181;", "&micro;", "¦Ì", "micro sign"},
{"&#182;", "&para;", "&#182;", "pilcrow sign = paragraph sign"},
{"&#183;", "&middot;", "¡¤", "middle dot = Georgian comma = Greek middle dot"},
{"&#184;", "&ccedil;", "&#184;", "cedilla = spacing cedilla"},
{"&#185;", "&sup1;", "1", "superscript one = superscript digit one"},
{"&#186;", "&ordm;", "o", "masculine ordinal indicator"},
{"&#187;", "&raquo;", "&#187;", "right-pointing double angle quotation mark = right pointing guillemet"},
{"&#188;", "&frac14;", "&#188;", "vulgar fraction one quarter = fraction one quarter"},
{"&#189;", "&frac12;", "&#189;", "vulgar fraction one half = fraction one half"},
{"&#190;", "&frac34;", "&#190;", "vulgar fraction three quarters = fraction three quarters"},
{"&#191;", "&iquest;", "&#191;", "inverted question mark = turned question mark"},
{"&#192;", "&Agrave;", "¨¤", "latin capital letter A with grave = latin capital letter A grave"},
{"&#193;", "&Aacute;", "¨¢", "latin capital letter A with acute"},
{"&#194;", "&Acirc;", "&#194;", "latin capital letter A with circumflex"},
{"&#195;", "&Atilde;", "&#195;", "latin capital letter A with tilde"},
{"&#196;", "&Auml;", "&#196;", "latin capital letter A with diaeresis"},
{"&#197;", "&Aring;", "&#197;", "latin capital letter A with ring above = latin capital letter A ring"},
{"&#198;", "&AElig;", "&#198;", "latin capital letter AE = latin capital ligature AE"},
{"&#199;", "&Ccedil;", "&#199;", "latin capital letter C with cedilla"},
{"&#200;", "&Egrave;", "¨¨", "latin capital letter E with grave"},
{"&#201;", "&Eacute;", "¨¦", "latin capital letter E with acute"},
{"&#202;", "&Ecirc;", "¨º", "latin capital letter E with circumflex"},
{"&#203;", "&Euml;", "&#203;", "latin capital letter E with diaeresis"},
{"&#204;", "&Igrave;", "¨¬", "latin capital letter I with grave"},
{"&#205;", "&Iacute;", "¨ª", "latin capital letter I with acute"},
{"&#206;", "&Icirc;", "&#206;", "latin capital letter I with circumflex"},
{"&#207;", "&Iuml;", "&#207;", "latin capital letter I with diaeresis"},
{"&#208;", "&ETH;", "D", "latin capital letter ETH"},
{"&#209;", "&Ntilde;", "&#209;", "latin capital letter N with tilde"},
{"&#210;", "&Ograve;", "¨°", "latin capital letter O with grave"},
{"&#211;", "&Oacute;", "¨®", "latin capital letter O with acute"},
{"&#212;", "&Ocirc;", "&#212;", "latin capital letter O with circumflex"},
{"&#213;", "&Otilde;", "&#213;", "latin capital letter O with tilde"},
{"&#214;", "&Ouml;", "&#214;", "latin capital letter O with diaeresis"},
{"&#215;", "&times;", "¡Á", "multiplication sign"},
{"&#216;", "&Oslash;", "&#216;", "latin capital letter O with stroke = latin capital letter O slash"},
{"&#217;", "&Ugrave;", "¨´", "latin capital letter U with grave"},
{"&#218;", "&Uacute;", "¨²", "latin capital letter U with acute"},
{"&#219;", "&Ucirc;", "&#219;", "latin capital letter U with circumflex"},
{"&#220;", "&Uuml;", "¨¹", "latin capital letter U with diaeresis"},
{"&#221;", "&Yacute;", "Y", "latin capital letter Y with acute"},
{"&#222;", "&THORN;", "T", "latin capital letter THORN"},
{"&#223;", "&szlig;", "&#223;", "latin small letter sharp s = ess-zed"},
{"&#224;", "&agrave;", "¨¤", "latin small letter a with grave = latin small letter a grave"},
{"&#225;", "&aacute;", "¨¢", "latin small letter a with acute"},
{"&#226;", "&acirc;", "a", "latin small letter a with circumflex"},
{"&#227;", "&atilde;", "&#227;", "latin small letter a with tilde"},
{"&#228;", "&auml;", "&#228;", "latin small letter a with diaeresis"},
{"&#229;", "&aring;", "&#229;", "latin small letter a with ring above = latin small letter a ring"},
{"&#230;", "&aelig;", "&#230;", "latin small letter ae = latin small ligature ae"},
{"&#231;", "&ccedil;", "&#231;", "latin small letter c with cedilla"},
{"&#232;", "&egrave;", "¨¨", "latin small letter e with grave"},
{"&#233;", "&eacute;", "¨¦", "latin small letter e with acute"},
{"&#234;", "&ecirc;", "¨º", "latin small letter e with circumflex"},
{"&#235;", "&euml;", "&#235;", "latin small letter e with diaeresis"},
{"&#236;", "&igrave;", "¨¬", "latin small letter i with grave"},
{"&#237;", "&iacute;", "¨ª", "latin small letter i with acute"},
{"&#238;", "&icirc;", "&#238;", "latin small letter i with circumflex"},
{"&#239;", "&iuml;", "&#239;", "latin small letter i with diaeresis"},
{"&#240;", "&eth;", "e", "latin small letter eth"},
{"&#241;", "&ntilde;", "&#241;", "latin small letter n with tilde"},
{"&#242;", "&ograve;", "¨°", "latin small letter o with grave"},
{"&#243;", "&oacute;", "¨®", "latin small letter o with acute"},
{"&#244;", "&ocirc;", "&#244;", "latin small letter o with circumflex"},
{"&#245;", "&otilde;", "&#245;", "latin small letter o with tilde"},
{"&#246;", "&ouml;", "&#246;", "latin small letter o with diaeresis"},
{"&#247;", "&divide;", "¡Â", "division sign"},
{"&#248;", "&oslash;", "&#248;", "latin small letter o with stroke = latin small letter o slash"},
{"&#249;", "&ugrave;", "¨´", "latin small letter u with grave"},
{"&#250;", "&uacute;", "¨²", "latin small letter u with acute"},
{"&#251;", "&ucirc;", "&#251;", "latin small letter u with circumflex"},
{"&#252;", "&uuml;", "¨¹", "latin small letter u with diaeresis"},
{"&#253;", "&yacute;", "y", "latin small letter y with acute"},
{"&#254;", "&thorn;", "t", "latin small letter thorn with"},
{"&#255;", "&yuml;", "&#255;", "latin small letter y with diaeresis"},
{"&#402;", "&fnof;", "&#402; ", "latin small f with hook = function = florin"},
{"&#913;", "&Alpha;", "¦¡ ", "greek capital letter alpha"},
{"&#914;", "&Beta;", "¦¢ ", "greek capital letter beta"},
{"&#915;", "&Gamma;", "¦£ ", "greek capital letter gamma"},
{"&#916;", "&Delta;", "¦¤ ", "greek capital letter delta"},
{"&#917;", "&Epsilon;", "¦¥ ", "greek capital letter epsilon"},
{"&#918;", "&Zeta;", "¦¦ ", "greek capital letter zeta"},
{"&#919;", "&Eta;", "¦§ ", "greek capital letter eta"},
{"&#920;", "&Theta;", "¦¨ ", "greek capital letter theta"},
{"&#921;", "&Iota;", "¦© ", "greek capital letter iota"},
{"&#922;", "&Kappa;", "¦ª ", "greek capital letter kappa"},
{"&#923;", "&Lambda;", "¦« ", "greek capital letter lambda"},
{"&#924;", "&Mu;", "¦¬ ", "greek capital letter mu"},
{"&#925;", "&Nu;", "¦­ ", "greek capital letter nu"},
{"&#926;", "&Xi;", "¦® ", "greek capital letter xi"},
{"&#927;", "&Omicron;", "¦¯ ", "greek capital letter omicron"},
{"&#928;", "&Pi;", "¦° ", "greek capital letter pi"},
{"&#929;", "&Rho;", "¦± ", "greek capital letter rho"},
{"&#931;", "&Sigma;", "¦² ", "greek capital letter sigma"},
{"&#932;", "&Tau;", "¦³ ", "greek capital letter tau"},
{"&#933;", "&Upsilon;", "¦´ ", "greek capital letter upsilon"},
{"&#934;", "&Phi;", "¦µ ", "greek capital letter phi"},
{"&#935;", "&Chi;", "¦¶ ", "greek capital letter chi"},
{"&#936;", "&Psi;", "¦· ", "greek capital letter psi"},
{"&#937;", "&Omega;", "¦¸ ", "greek capital letter omega"},
{"&#945;", "&alpha;", "¦Á ", "greek small letter alpha"},
{"&#946;", "&beta;", "¦Â ", "greek small letter beta"},
{"&#947;", "&gamma;", "¦Ã ", "greek small letter gamma"},
{"&#948;", "&delta;", "¦Ä ", "greek small letter delta"},
{"&#949;", "&epsilon;", "¦Å ", "greek small letter epsilon"},
{"&#950;", "&zeta;", "¦Æ ", "greek small letter zeta"},
{"&#951;", "&eta;", "¦Ç ", "greek small letter eta"},
{"&#952;", "&theta;", "¦È ", "greek small letter theta"},
{"&#953;", "&iota;", "¦É ", "greek small letter iota"},
{"&#954;", "&kappa;", "¦Ê ", "greek small letter kappa"},
{"&#955;", "&lambda;", "¦Ë ", "greek small letter lambda"},
{"&#956;", "&mu;", "¦Ì ", "greek small letter mu"},
{"&#957;", "&nu;", "¦Í ", "greek small letter nu"},
{"&#958;", "&xi;", "¦Î ", "greek small letter xi"},
{"&#959;", "&omicron;", "¦Ï ", "greek small letter omicron"},
{"&#960;", "&pi;", "¦Ð ", "greek small letter pi"},
{"&#961;", "&rho;", "¦Ñ ", "greek small letter rho"},
{"&#962;", "&sigmaf;", "&#962; ", "greek small letter final sigma"},
{"&#963;", "&sigma;", "¦Ò ", "greek small letter sigma"},
{"&#964;", "&tau;", "¦Ó ", "greek small letter tau"},
{"&#965;", "&upsilon;", "¦Ô ", "greek small letter upsilon"},
{"&#966;", "&phi;", "¦Õ ", "greek small letter phi"},
{"&#967;", "&chi;", "¦Ö ", "greek small letter chi"},
{"&#968;", "&psi;", "¦× ", "greek small letter psi"},
{"&#969;", "&omega;", "¦Ø ", "greek small letter omega"},
{"&#977;", "&thetasym;", "&#977; ", "greek small letter theta symbol"},
{"&#978;", "&upsih;", "&#978; ", "greek upsilon with hook symbol"},
{"&#982;", "&piv;", "&#982; ", "greek pi symbol"},
{"&#8226;", "&bull;", "&#8226;", "bullet = black small circle"},
{"&#8230;", "&hellip;", "¡­", "horizontal ellipsis = three dot leader"},
{"&#8242;", "&prime;", "¡ä", "prime = minutes = feet"},
{"&#8243;", "&Prime;", "¡å", "double prime = seconds = inches"},
{"&#8254;", "&oline;", "£þ", "overline = spacing overscore"},
{"&#8260;", "&frasl;", "&#8260;", "fraction slash"},
{"&#8472;", "&weierp;", "&#8472;", "script capital P = power set = Weierstrass p"},
{"&#8465;", "&image;", "&#8465;", "blackletter capital I = imaginary part"},
{"&#8476;", "&real;", "&#8476;", "blackletter capital R = real part symbol"},
{"&#8482;", "&trade;", "&#8482;", "trade mark sign"},
{"&#8501;", "&alefsym;", "&#8501;", "alef symbol = first transfinite cardinal"},
{"&#8592;", "&larr;", "¡û", "leftwards arrow"},
{"&#8593;", "&uarr;", "¡ü", "upwards arrow"},
{"&#8594;", "&rarr;", "¡ú", "rightwards arrow"},
{"&#8595;", "&darr;", "¡ý", "downwards arrow"},
{"&#8596;", "&harr;", "&#8596;", "left right arrow"},
{"&#8629;", "&crarr;", "&#8629;", "downwards arrow with corner leftwards = carriage return"},
{"&#8656;", "&lArr;", "&#8656;", "leftwards double arrow"},
{"&#8657;", "&uArr;", "&#8657;", "upwards double arrow"},
{"&#8658;", "&rArr;", "&#8658;", "rightwards double arrow"},
{"&#8659;", "&dArr;", "&#8659;", "downwards double arrow"},
{"&#8660;", "&hArr;", "&#8660;", "left right double arrow"},
{"&#8704;", "&forall;", "&#8704;", "for all"},
{"&#8706;", "&part;", "&#8706;", "partial differential"},
{"&#8707;", "&exist;", "&#8707;", "there exists"},
{"&#8709;", "&empty;", "&#8709;", "empty set = null set = diameter"},
{"&#8711;", "&nabla;", "&#8711;", "nabla = backward difference"},
{"&#8712;", "&isin;", "¡Ê", "element of"},
{"&#8713;", "&notin;", "&#8713;", "not an element of"},
{"&#8715;", "&ni;", "&#8715;", "contains as member"},
{"&#8719;", "&prod;", "¡Ç", "n-ary product = product sign"},
{"&#8721;", "&sum;", "¡Æ", "n-ary sumation"},
{"&#8722;", "&minus;", "&#8722;", "minus sign"},
{"&#8727;", "&lowast;", "&#8727;", "asterisk operator"},
{"&#8730;", "&radic;", "¡Ì", "square root = radical sign"},
{"&#8733;", "&prop;", "¡Ø", "proportional to"},
{"&#8734;", "&infin;", "¡Þ", "infinity"},
{"&#8736;", "&ang;", "¡Ï", "angle"},
{"&#8743;", "&and;", "¡Ä", "logical and = wedge"},
{"&#8744;", "&or;", "¡Å", "logical or = vee"},
{"&#8745;", "&cap;", "¡É", "intersection = cap"},
{"&#8746;", "&cup;", "¡È", "union = cup"},
{"&#8747;", "&int;", "¡Ò", "integral"},
{"&#8756;", "&there4;", "¡à", "therefore"},
{"&#8764;", "&sim;", "¡«", "tilde operator = varies with = similar to"},
{"&#8773;", "&cong;", "&#8773;", "approximately equal to"},
{"&#8776;", "&asymp;", "¡Ö", "almost equal to = asymptotic to"},
{"&#8800;", "&ne;", "¡Ù", "not equal to"},
{"&#8801;", "&equiv;", "¡Ô", "identical to"},
{"&#8804;", "&le;", "¡Ü", "less-than or equal to"},
{"&#8805;", "&ge;", "¡Ý", "greater-than or equal to"},
{"&#8834;", "&sub;", "&#8834;", "subset of"},
{"&#8835;", "&sup;", "&#8835;", "superset of"},
{"&#8836;", "&nsub;", "&#8836;", "not a subset of"},
{"&#8838;", "&sube;", "&#8838;", "subset of or equal to"},
{"&#8839;", "&supe;", "&#8839;", "superset of or equal to"},
{"&#8853;", "&oplus;", "¨’", "circled plus = direct sum"},
{"&#8855;", "&otimes;", "&#8855;", "circled times = vector product"},
{"&#8869;", "&perp;", "¡Í", "up tack = orthogonal to = perpendicular"},
{"&#8901;", "&sdot;", "&#8901;", "dot operator"},
{"&#8968;", "&lceil;", "&#8968;", "left ceiling = apl upstile"},
{"&#8969;", "&rceil;", "&#8969;", "right ceiling"},
{"&#8970;", "&lfloor;", "&#8970;", "left floor = apl downstile"},
{"&#8971;", "&rfloor;", "&#8971;", "right floor"},
{"&#9001;", "&lang;", "¡´", "left-pointing angle bracket = bra"},
{"&#9002;", "&rang;", "¡µ", "right-pointing angle bracket = ket"},
{"&#9674;", "&loz;", "&#9674;", "lozenge"},
{"&#9824;", "&spades;", "&#9824;", "black spade suit"},
{"&#9827;", "&clubs;", "&#9827;", "black club suit = shamrock"},
{"&#9829;", "&hearts;", "&#9829;", "black heart suit = valentine"},
{"&#9830;", "&diams;", "&#9830;", "black diamond suit"},
{"&#34;", "&quot;", "\"", "quotation mark = APL quote"},
{"&#38;", "&amp;", "& ", "ampersand"},
{"&#60;", "&lt;", "< ", "less-than sign"},
{"&#62;", "&gt;", "> ", "greater-than sign"},
{"&#338;", "&OElig;", "&#338; ", "latin capital ligature OE"},
{"&#339;", "&oelig;", "&#339; ", "latin small ligature oe"},
{"&#352;", "&Scaron;", "&#352; ", "latin capital letter S with caron"},
{"&#353;", "&scaron;", "&#353; ", "latin small letter s with caron"},
{"&#376;", "&Yuml;", "&#376; ", "latin capital letter Y with diaeresis"},
{"&#710;", "&circ;", "&#710; ", "modifier letter circumflex accent"},
{"&#732;", "&tilde;", "&#732; ", "small tilde"},
{"&#8194;", "&ensp;", "&#8194;", "en space"},
{"&#8195;", "&emsp;", "&#8195;", "em space"},
{"&#8201;", "&thinsp;", "&#8201;", "thin space"},
{"&#8204;", "&zwnj;", "&#8204;", "zero width non-joiner"},
{"&#8205;", "&zwj;", "&#8205;", "zero width joiner"},
{"&#8206;", "&lrm;", "&#8206;", "left-to-right mark"},
{"&#8207;", "&rlm;", "&#8207;", "right-to-left mark"},
{"&#8211;", "&ndash;", "¨C", "en dash"},
{"&#8212;", "&mdash;", "¡ª", "em dash"},
{"&#8216;", "&lsquo;", "¡®", "left single quotation mark"},
{"&#8217;", "&rsquo;", "¡¯", "right single quotation mark"},
{"&#8218;", "&sbquo;", "&#8218;", "single low-9 quotation mark"},
{"&#8220;", "&ldquo;", "¡°", "left double quotation mark"},
{"&#8221;", "&rdquo;", "¡±", "right double quotation mark"},
{"&#8222;", "&bdquo;", "&#8222;", "double low-9 quotation mark"},
{"&#8224;", "&dagger;", "&#8224;", "dagger"},
{"&#8225;", "&Dagger;", "&#8225;", "double dagger"},
{"&#8240;", "&permil;", "¡ë", "per mille sign"},
{"&#8249;", "&lsaquo;", "&#8249;", "single left-pointing angle quotation mark"},
{"&#8250;", "&rsaquo;", "&#8250;", "single right-pointing angle quotation mark"},
{"&#8364;", "&euro;", "€", "euro sign"}
};
#ifndef CHARCODE_FIND
#define CHARCODE_FIND(_s, _m, _n) \
{ \
_m = 0;_n = 0; \
while(_n < CHARCODE_NUM)  \
{ \
_m = strlen(charcodelist[_n].dec); \
if(strncasecmp(_s, charcodelist[_n].dec, m) == 0)  \
{ \
break; \
} \
_m = strlen(charcodelist[_n].code); \
if(strncasecmp(_s, charcodelist[_n].code, m)  == 0) \
{ \
break; \
} \
_n++; \
} \
}
#endif
#endif




 wilbur8415 »Ø¸´ÓÚ£º2008-07-03 19:28:56

²»´í 
ºÃ¶«Î÷

[ ±¾Ìû×îºóÓÉ wilbur8415 ÓÚ 2008-7-3 19:58 ±à¼­ ]


 tyc611 »Ø¸´ÓÚ£º2008-07-03 22:20:46

ʲô½Ð¡°µ¹ÅÅË÷Òý¿â¡±£¬É¶Òâ˼£¬LZÄÜ·ñ½âÊÍÏÂÏÂ


 77h2_eleven »Ø¸´ÓÚ£º2008-07-03 23:03:23

´óѧ±ÏÒµÉè¼Æ×öµÄÊÇËÑË÷ÒýÇæ¡£Ö±½ÓÓÃlucene.£¨ÊÇÕâôƴ°É£¬¶¼¸øÍüÁË£©


 redor »Ø¸´ÓÚ£º2008-07-04 08:28:16

ÒýÓãºÔ­ÌûÓÉ tyc611 ÓÚ 2008-7-3 22:20 ·¢±í [url=http://bbs.chinaunix.net/redirect.php?goto=findpost&pid=8731584&ptid=1187515]
ʲô½Ð¡°µ¹ÅÅË÷Òý¿â¡±£¬É¶Òâ˼£¬LZÄÜ·ñ½âÊÍÏÂÏ 




ʵÏÖÁËÒ»¸öµ¹ÅÅË÷Òý,ÊÇ¿âµÄÐÎʽ·¢²¼.... ²»ÊÇÍê³ÉµÄËÑË÷½â¾ö·½°¸, Ò²¾ÍÊÇÖ»¸ºÔðË÷ÒýÊý¾ÝºÍ¼ìË÷.... 
Òª×öÒ»¸öÍê³ÉµÄËÑË÷ÒýÇæ¾ÍÐèÒª×Ô¼º¿ª·¢ÆäËûµÄ¶«Î÷,±ÈÈçÊý¾ÝÏÂÔØ,daemon·þÎñµÈ....




Ô­ÎÄÁ´½Ó£ºhttp://bbs.chinaunix.net/viewthread.php?tid=1187515
×ªÔØÇë×¢Ã÷×÷ÕßÃû¼°Ô­Îijö´¦