<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sparkle&#039;s Workshop &#187; python</title>
	<atom:link href="http://weavesky.com/tag/python/feed/" rel="self" type="application/rss+xml" />
	<link>http://weavesky.com</link>
	<description></description>
	<lastBuildDate>Fri, 30 Dec 2011 08:14:49 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>python在生产环境可选的memcached lib</title>
		<link>http://weavesky.com/2009/05/15/python-memcached-lib-in-production/</link>
		<comments>http://weavesky.com/2009/05/15/python-memcached-lib-in-production/#comments</comments>
		<pubDate>Fri, 15 May 2009 03:06:56 +0000</pubDate>
		<dc:creator>Sparkle</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[memcached]]></category>
		<category><![CDATA[python]]></category>

		<guid isPermaLink="false">http://weavesky.com/?p=570</guid>
		<description><![CDATA[memcached对动态语言帮助很大，因为动态语言的模式和实际的部署模型，python/php/ruby等不可能像Java那样在JVM内存中开辟一块内存来缓冲数据（而实际上Java这样做也会遇到容量不够，GC，集群等问题）。不过在实际使用中，我发现python memcached lib并没有想象中那么成熟、完整，经过一番研究之后，目前至少能勉强在生产环境中使用。 从memcached官方wiki中可以看到，python还是有不少可以使用的lib的，但是经过测试和比较之后，发现选择的方案也不多。我们还是从比较出名的web框架入手吧，毫无疑问，Django是目前python最好的框架之一，在生产环境使用它的人也比较多，而且它的文档很详细，有一节就是专门提到cache的部分 。Django推荐使用cmemcache，在不能使用cmemcache的情况（例如windows机器），就使用python-memcached。经过我的实际测试，这个或许不是性能最好，版本最新，功能最多的选择，但是是一个很稳靠的选择。 cmemcache封装的是libmemcache，这个类库很久没有更新了，目前libmemcached比较活跃，功能也比较全面。这里值得一提的是Python libmemcached是来自豆瓣贡献的类库，不过因为使用的人不多，所以最终我没有选择。另外还有一个pylibmc也是对libmemcached的封装，这是cmemcache_hash的作者写的类库（稍后会提到cmemcache_hash），很可惜我一直没有编译成功。 但是实际使用cmemcache/python-memcached的组合也是要进行一些封装的，首先有cmemcache不是线程安全的问题 ，另外就是Python libmemcached的hash算法有问题。什么？你从来不用超过1个的memcached服务器？我还是建议你至少用2个memcached服务器吧，至少有backup。 而cmemcache和Python libmemcached的hash算法不一样。这里我们还需要cmemcache_hash，名字可能有少少误导，它的作用是领到Python libmemcached的hash跟cmemcache一致 于是我们的封装代码大概是这样 try: import cmemcache as memcache logger.warn&#40;'load cmemcache'&#41; # although cmemcache might be thread safe # but we still make it thread local # also it can &#8230; <a class="more-link" href="http://weavesky.com/2009/05/15/python-memcached-lib-in-production/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>memcached对动态语言帮助很大，因为动态语言的模式和实际的部署模型，python/php/ruby等不可能像Java那样在JVM内存中开辟一块内存来缓冲数据（而实际上Java这样做也会遇到容量不够，GC，集群等问题）。不过在实际使用中，我发现python memcached lib并没有想象中那么成熟、完整，经过一番研究之后，目前至少能勉强在生产环境中使用。</p>
<p> <a href="http://code.google.com/p/memcached/wiki/Clients">从memcached官方wiki中可以看到</a>，python还是有不少可以使用的lib的，但是经过测试和比较之后，发现选择的方案也不多。我们还是从比较出名的web框架入手吧，毫无疑问，Django是目前python最好的框架之一，在生产环境使用它的人也比较多，而且它的文档很详细，<a href="http://docs.djangoproject.com/en/dev/topics/cache/#memcached">有一节就是专门提到cache的部分</a> 。Django推荐使用cmemcache，在不能使用cmemcache的情况（例如windows机器），就使用python-memcached。经过我的实际测试，这个或许不是性能最好，版本最新，功能最多的选择，但是是一个很稳靠的选择。</p>
<p>cmemcache封装的是libmemcache，这个类库很久没有更新了，目前libmemcached比较活跃，功能也比较全面。<a href="http://code.google.com/p/python-libmemcached">这里值得一提的是Python libmemcached是来自豆瓣贡献的类库</a>，不过因为使用的人不多，所以最终我没有选择。<a href="http://pypi.python.org/pypi/pylibmc">另外还有一个pylibmc也是对libmemcached的封装</a>，这是cmemcache_hash的作者写的类库（稍后会提到cmemcache_hash），很可惜我一直没有编译成功。</p>
<p>但是实际使用cmemcache/python-memcached的组合也是要进行一些封装的，<a href="http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/">首先有cmemcache不是线程安全的问题</a> ，另外就是Python libmemcached的hash算法有问题。什么？你从来不用超过1个的memcached服务器？我还是建议你至少用2个memcached服务器吧，至少有backup。</p>
<p>而cmemcache和Python libmemcached的hash算法不一样。<a href="http://pypi.python.org/pypi/cmemcache_hash">这里我们还需要cmemcache_hash</a>，名字可能有少少误导，它的作用是领到Python libmemcached的hash跟cmemcache一致</p>
<p>于是我们的封装代码大概是这样</p>

<div class="wp_syntax"><div class="code"><pre class="python" style="font-family:monospace;"><span style="color: #ff7700;font-weight:bold;">try</span>:
    <span style="color: #ff7700;font-weight:bold;">import</span> cmemcache <span style="color: #ff7700;font-weight:bold;">as</span> memcache
    logger.<span style="color: black;">warn</span><span style="color: black;">&#40;</span><span style="color: #483d8b;">'load cmemcache'</span><span style="color: black;">&#41;</span>
    <span style="color: #808080; font-style: italic;"># although cmemcache might be thread safe</span>
    <span style="color: #808080; font-style: italic;"># but we still make it thread local</span>
    <span style="color: #808080; font-style: italic;"># also it can use separate socket connect in each thread for more performance</span>
    <span style="color: #ff7700;font-weight:bold;">from</span> <span style="color: #dc143c;">threading</span> <span style="color: #ff7700;font-weight:bold;">import</span> local
<span style="color: #ff7700;font-weight:bold;">except</span> <span style="color: #008000;">ImportError</span>, e:
    logger.<span style="color: black;">warn</span><span style="color: black;">&#40;</span><span style="color: #483d8b;">'cmemcache error: %s'</span>, e<span style="color: black;">&#41;</span>
    <span style="color: #ff7700;font-weight:bold;">import</span> memcache
    <span style="color: #ff7700;font-weight:bold;">import</span> cmemcache_hash
    logger.<span style="color: black;">warn</span><span style="color: black;">&#40;</span><span style="color: #483d8b;">'load python-memcache with cmemcache_hash'</span><span style="color: black;">&#41;</span>
    <span style="color: #808080; font-style: italic;"># python-memcache is already using thread local</span>
    <span style="color: #ff7700;font-weight:bold;">class</span> local<span style="color: black;">&#40;</span><span style="color: black;">&#41;</span>:
        <span style="color: #ff7700;font-weight:bold;">pass</span>
&nbsp;
<span style="color: #ff7700;font-weight:bold;">class</span> Memcache<span style="color: black;">&#40;</span>local<span style="color: black;">&#41;</span>:
    <span style="color: #ff7700;font-weight:bold;">def</span> <span style="color: #0000cd;">__init__</span><span style="color: black;">&#40;</span><span style="color: #008000;">self</span>, servers<span style="color: black;">&#41;</span>:
        <span style="color: #008000;">self</span>._current = memcache.<span style="color: black;">Client</span><span style="color: black;">&#40;</span>servers<span style="color: black;">&#41;</span>
    <span style="color: #ff7700;font-weight:bold;">def</span> current<span style="color: black;">&#40;</span><span style="color: #008000;">self</span><span style="color: black;">&#41;</span>:
        <span style="color: #ff7700;font-weight:bold;">return</span> <span style="color: #008000;">self</span>._current</pre></div></div>

<h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li><a href="http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/" title="python cmemcache是不是线程安全的">python cmemcache是不是线程安全的</a></li><li><a href="http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/" title="python-memcached是不是线程安全的">python-memcached是不是线程安全的</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://weavesky.com/2009/05/15/python-memcached-lib-in-production/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>python cmemcache是不是线程安全的</title>
		<link>http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/</link>
		<comments>http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/#comments</comments>
		<pubDate>Sat, 14 Feb 2009 03:45:12 +0000</pubDate>
		<dc:creator>Sparkle</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[memcached]]></category>
		<category><![CDATA[python]]></category>

		<guid isPermaLink="false">http://weavesky.com/?p=560</guid>
		<description><![CDATA[答案是，我不确定，但是我更倾向于认为它是线程不安全的 原因在于 1、网上任何讨论，都从未提及过cmemcache所用的libmemcache是线程安全的，也没有提及过cmemcache实现了线程安全，而libmemcached从一开始就强调自己是线程安全的 2、我个人不太熟悉C代码，所以看libmemcache的代码也没有办法判断出来，但是我看到cmemcache的c接口代码在针对socket操作的代码前后使用了Py_BEGIN_ALLOW_THREADS;Py_END_ALLOW_THREADS;进行包围，而这两个宏的作用，是解除GIL，让多线程可以进入相应的代码。天啊，本来我们还期望对socket操作进行加锁，现在竟然还竟然解除GIL。本来因为GIL的存在，可能还有些希望，现在cmemcache为了让socket操作不要阻塞，反而令到自己是线程不安全的。（如有理解错误请指正） 3、python一直习惯的部署模型是单线程多进程，所以线程安全对很多类库来说，并不重要也不考虑。但是现在越来越多的python程序部署使用了多线程的模型（又或者多线程多进程），线程安全问题也凸显出来 综上所属，我的结论是，我不确定是否线程安全的，呵呵，但是我认为要进行线程安全的修正，至少没有坏处 修正方法很简单，直接套用python-memcached的做法（至于这种做法的优劣也在那篇文章有提及到） import cmemcache as memcache from threading import local class Memcache&#40;local&#41;: def __init__&#40;self, servers&#41;: self._current = memcache.Client&#40;servers&#41; def current&#40;self&#41;: return self._current Related Postspython在生产环境可选的memcached libpython-memcached是不是线程安全的]]></description>
			<content:encoded><![CDATA[<p>答案是，我不确定，但是我更倾向于认为它是线程不安全的</p>
<p>原因在于<br />
1、网上任何讨论，都从未提及过cmemcache所用的libmemcache是线程安全的，也没有提及过cmemcache实现了线程安全，而libmemcached从一开始就强调自己是线程安全的<br />
2、我个人不太熟悉C代码，所以看libmemcache的代码也没有办法判断出来，但是我看到cmemcache的c接口代码在针对socket操作的代码前后使用了Py_BEGIN_ALLOW_THREADS;Py_END_ALLOW_THREADS;进行包围，而这两个宏的作用，是解除GIL，让多线程可以进入相应的代码。天啊，本来我们还期望对socket操作进行加锁，现在竟然还竟然解除GIL。本来因为GIL的存在，可能还有些希望，现在cmemcache为了让socket操作不要阻塞，反而令到自己是线程不安全的。（如有理解错误请指正）<br />
3、python一直习惯的部署模型是单线程多进程，所以线程安全对很多类库来说，并不重要也不考虑。但是现在越来越多的python程序部署使用了多线程的模型（又或者多线程多进程），线程安全问题也凸显出来</p>
<p>综上所属，我的结论是，我不确定是否线程安全的，呵呵，但是我认为要进行线程安全的修正，至少没有坏处</p>
<p>修正方法很简单，直接套用<a href="http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/">python-memcached的做法</a>（至于这种做法的优劣也在那篇文章有提及到）</p>

<div class="wp_syntax"><div class="code"><pre class="python" style="font-family:monospace;"><span style="color: #ff7700;font-weight:bold;">import</span> cmemcache <span style="color: #ff7700;font-weight:bold;">as</span> memcache
<span style="color: #ff7700;font-weight:bold;">from</span> <span style="color: #dc143c;">threading</span> <span style="color: #ff7700;font-weight:bold;">import</span> local
<span style="color: #ff7700;font-weight:bold;">class</span> Memcache<span style="color: black;">&#40;</span>local<span style="color: black;">&#41;</span>:
    <span style="color: #ff7700;font-weight:bold;">def</span> <span style="color: #0000cd;">__init__</span><span style="color: black;">&#40;</span><span style="color: #008000;">self</span>, servers<span style="color: black;">&#41;</span>:
        <span style="color: #008000;">self</span>._current = memcache.<span style="color: black;">Client</span><span style="color: black;">&#40;</span>servers<span style="color: black;">&#41;</span>
    <span style="color: #ff7700;font-weight:bold;">def</span> current<span style="color: black;">&#40;</span><span style="color: #008000;">self</span><span style="color: black;">&#41;</span>:
        <span style="color: #ff7700;font-weight:bold;">return</span> <span style="color: #008000;">self</span>._current</pre></div></div>

<h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li><a href="http://weavesky.com/2009/05/15/python-memcached-lib-in-production/" title="python在生产环境可选的memcached lib">python在生产环境可选的memcached lib</a></li><li><a href="http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/" title="python-memcached是不是线程安全的">python-memcached是不是线程安全的</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>python-memcached是不是线程安全的</title>
		<link>http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/</link>
		<comments>http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/#comments</comments>
		<pubDate>Thu, 22 Jan 2009 07:16:45 +0000</pubDate>
		<dc:creator>Sparkle</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[memcached]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[thread]]></category>

		<guid isPermaLink="false">http://weavesky.com/?p=553</guid>
		<description><![CDATA[答案是肯定的，前提你在使用Python 2.4+和python-memcached 1.36+ 为什么我们需要线程安全的memcached client，因为我们的实际应用一般是多线程的模型，例如cherrypy、twisted，如果python-memcached不是线程安全的话，引起的问题不仅仅是并发修改共享变量这么简单，是外部socket链接的数据流的混乱 python-memcached怎么实现线程安全的呢？查看源代码看到 try: # Only exists in Python 2.4+ from threading import local except ImportError: # TODO: add the pure-python local implementation class local&#40;object&#41;: pass &#160; &#160; class Client&#40;local&#41;: 很取巧的让Client类继承threading.local，也就是Client里面的每一个属性都是跟当前线程绑定的。实现虽然不太优雅，但是很实在 但是别以为这样就可以随便在线程里面用python-memcached了，因为这种thread local的做法，你的应用必须要使用thread pool的模式，而不能不停创建销毁thread，因为每一个新线程的创建，对于就会使用一个全新的Client，也就是一个全新的socket链接，如果不停打开创建销毁thread的话，就会导致不停的创建销毁socket链接，导致性能大量下降。幸好，无论是cherrypy还是twisted，都是使用了thread pool的模式 参考资料： http://code.djangoproject.com/ticket/3701 &#8230; <a class="more-link" href="http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>答案是肯定的，前提你在使用Python 2.4+和python-memcached 1.36+<br />
为什么我们需要线程安全的memcached client，因为我们的实际应用一般是多线程的模型，例如cherrypy、twisted，如果python-memcached不是线程安全的话，引起的问题不仅仅是并发修改共享变量这么简单，是外部socket链接的数据流的混乱<br />
python-memcached怎么实现线程安全的呢？查看源代码看到</p>

<div class="wp_syntax"><div class="code"><pre class="python" style="font-family:monospace;"><span style="color: #ff7700;font-weight:bold;">try</span>:
    <span style="color: #808080; font-style: italic;"># Only exists in Python 2.4+</span>
    <span style="color: #ff7700;font-weight:bold;">from</span> <span style="color: #dc143c;">threading</span> <span style="color: #ff7700;font-weight:bold;">import</span> local
<span style="color: #ff7700;font-weight:bold;">except</span> <span style="color: #008000;">ImportError</span>:
    <span style="color: #808080; font-style: italic;"># TODO:  add the pure-python local implementation</span>
    <span style="color: #ff7700;font-weight:bold;">class</span> local<span style="color: black;">&#40;</span><span style="color: #008000;">object</span><span style="color: black;">&#41;</span>:
        <span style="color: #ff7700;font-weight:bold;">pass</span>
&nbsp;
&nbsp;
<span style="color: #ff7700;font-weight:bold;">class</span> Client<span style="color: black;">&#40;</span>local<span style="color: black;">&#41;</span>:</pre></div></div>

<p>很取巧的让Client类继承threading.local，也就是Client里面的每一个属性都是跟当前线程绑定的。实现虽然不太优雅，但是很实在<br />
但是别以为这样就可以随便在线程里面用python-memcached了，因为这种thread local的做法，你的应用必须要使用thread pool的模式，而不能不停创建销毁thread，因为每一个新线程的创建，对于就会使用一个全新的Client，也就是一个全新的socket链接，如果不停打开创建销毁thread的话，就会导致不停的创建销毁socket链接，导致性能大量下降。幸好，无论是cherrypy还是twisted，都是使用了thread pool的模式</p>
<p>参考资料：<br />
<a href="http://code.djangoproject.com/ticket/3701">http://code.djangoproject.com/ticket/3701</a><br />
<a href="http://lists.danga.com/pipermail/memcached/2007-June/004482.html">http://lists.danga.com/pipermail/memcached/2007-June/004482.html</a></p>
<h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li><a href="http://weavesky.com/2009/05/15/python-memcached-lib-in-production/" title="python在生产环境可选的memcached lib">python在生产环境可选的memcached lib</a></li><li><a href="http://weavesky.com/2009/02/14/is-python-cmemcache-threadsafe/" title="python cmemcache是不是线程安全的">python cmemcache是不是线程安全的</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://weavesky.com/2009/01/22/is-python-memcached-threadsafe/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

